אגרגציה - Aggregation

אגרגציה בעולם הבינה העסקית הנה בעלת חשיבות לא מבוטלת.

בד"כ אנו מדברים על טבלאות אגרגציה המחזיקות נתונים מסוכמים, במקום אותן טבלאות מפורטות. כמו בהרבה סוגיות, יש פנים לכאן ולכאן, למה אגרגציה טובה, או לא.

אגרגציה הנה למעשה דרך לממש בפועל קבוצות חלקיות של קוביות רב ממדיות.

 

בהכללה ניתן לומר שהיתרון המרכזי של טבלאות מסוכמות הנו שיפור ברמת ביצועים;

החיסרון המרכזי, אין אפשרות להגיע לנתון מפורט יותר (אלא אם מחזיקים גם טבלאות סיכומיות אגרגטיביות, וגם נתונים מפורטים ואז יש שיקולי מיקום ועקביות). בנוסף- מחייב תחזוקה.

 

מתי כדאי בכל זאת לעשות שימוש באגרגציה? (כמה המלצות התקבלו על סמך הרצאה של SAP):

 

  • כאשר היחס בין נתוני הבסיס לנתונים הסיכומיים משמעותי (כיווץ לפחות פי 10).
  • כאשר מדובר בגישות פופולאריות אליהם ניגשים יותר; הבטיחו לעצמכם לא לבצע אגרגציה על כל הממדים, רק על חלק...
  • לא יותר מידי ממוקד; מאידך לא מוכלל מידי. חפשו את שביל הזהב.
  • כאשר מדובר בנתונים שאכן גם ניגשו אליהם לאחרונה (לא רק כאלו שהיו שימושיים לפני שנה).

 

יש לתת את הדעת גם על ההיבטים העסקיים:

עד כמה יהיה צורך לגשת לנתוני משנה לצורך קבלת החלטות?

במידה ויבקשו לגשת לנתונים מפורטים יותר, מה מחיר העיכוב, שהנתונים אינם בנמצא?

ומאידך-

האם הוספת נתונים אכן מוסיפה למשתמש, או יותר מבלבלת, וכלל אינה תורמת לקבלת ההחלטות?

 

כאמור, אין תשובות חד-משמעיות, אך בהחלט יש כאן שיקולים שיסייעו בקבלת ההחלטה.