ROM Knowledgeware - ירחון

ירחון 2Know לניהול ידע

גיליון יוני 2021 - מהדורה מס' 261

גיליון:

חדשות: חדשות- יוני 2021

נכתב ע"י ד"ר מוריה לוי

1. חברת ROM מגייסת:

עורך תוכן בעל יכולת פיצוח מידע מורכב וכתיבתו בדרך פשוטה
עובד תוכן עם אוריינטציה טכנולוגית בהקמת דפים מעוצבים במערכות ניהול תוכן. העבודה באנגלית
מנהל פרויקט דיגיטל להקמת אתרים בסביבה מתקדמת כחלק מפרויקט ענק. העבודה באנגלית.

קורות חיים ניתן לשלוח ל inbalh@kmrom.co.il

2. קורס ניהול ידע בפורמט דיגיטלי ייפתח מיד לאחר החגים בתחילת אוקטובר. לסילבוס והרשמה לחצו כאן

קורות חיים ניתן לשלוח ל inbalh@kmrom.co.il

לפרטים ושאלות נוספות נא פנו לדנה- 050-6676188

3. ד״ר מוריה לוי מפנה את תפקידה כמובילת פורום ניהול ידע בישראל, כדי להתרכז בפעילות הבינלאומית של שיתופי פעולה בניהול ידע ברמה עולמית. נשמח לחברים המבקשים להתנדב למשימה חשובה זו. נא פנו- moria@kmrom.com

4. כנס ניהול הידע השנתי של פורום ניהול ידע מתקרב. נשמח להצעות שלכם להצטרף ולהציע הרצאות, סיפורי מקרה,

מתודולוגיות ועוד. נא פנו - anat@kmrom.com

סקירה: ניהול ידע ירוק

נכתב ע"י מיכל בלומנפלד

יותר ממיליארד בני אדם ברחבי העולם מציינים כל שנה בסוף אפריל את "יום כדור הארץ העולמי", להעלאת המודעות להגנת הסביבה ולשמירה על כדור הארץ.

את יום כדור הארץ יזם סנאטור דמוקרטי מוויסקונסין, לאחר שב-1969 נשפכו שלושה מיליון גלונים של נפט מאתר קידוח לחופי סנטה ברברה, קליפורניה, והרגו כ-10,000 עופות, דולפינים וכלבי ים. כבר ביום כדור הארץ הראשון של 1970 יצאו 20 מיליון אמריקאים – 10% מאוכלוסיית ארצות הברית – להפגין ברחובות למען שורה ארוכה של נושאי סביבה כמו דליפות נפט, חומרי הדברה, הכחדת מינים, זיהום אוויר וכריתת יערות.

51 שנה מאז יום כדה"א הראשון, מצער לומר שהמצב לא השתפר, אלא הפוך מכך. משבר האקלים הוא ככל הנראה המשבר החמור ביותר המאיים על שלום העולם כיום. מרביתנו כבר הבנו שאי אפשר לעסוק במצבו של כדור הארץ רק יום בשנה, יש לעשות זאת מדי יום. למעשה כדאי לחפש ולמצוא דרכים להטמיע קיימות בכל פן מחיינו - באופן בו אנו צורכים, מתניידים ומתנהלים, בחיי היומיום האישיים וגם בארגונים שלנו. התחזיות של המדענים אמנם מבהילות, אבל אין מקום לייאוש. מצד שני, יש עוד פחות מקום לאדישות ולפסיביות. יש הרבה מה לעשות. אחת הדרכים הללו היא ניהול ידע ירוק.

בעצם ניתן לטעון שמעצם מהותו, ניהול ידע הוא ירוק. המהפכה שניהול הידע מוביל, צמצמה, בין היתר, גם את כמויות הניירת שבארגונים. בגדולים שבהם, מדובר כנראה בהצלת יער קטן - מעצם כך שרוב המסמכים הפיזיים הפכו למסמכים דיגיטליים ותויקו בספריות בפורטלים ארגוניים, במקום בקלסרים עבי כרס. זאת אומרת שמעצם הגדרתה, מהפכת ניהול הידע היא מהפכה ירוקה. עלינו לחשוב על כך בגאווה ולחתור להטמיע את החשיבה הירוקה בכל צעד בו התחום הזה שואף להתפתח.
האם זה הולך לעלות לארגון כסף? בטווח הארוך ניהול ושיתוף ידע דווקא חוסך במשאבים. למעשה בשונה מהתפיסה השגויה שקיימות עולה כסף, קיימות מעצם הדרישה להתייעל ולמחזר, דווקא יכולה לחסוך. החל בחיסכון בניירת ובהדפסות ועד להטמעת הפקות לקחים כחלק מהתרבות הארגונית, כך שתסייע לנו להימנע מלחזור על טעויות ולבזבז משאבים.

שיתוף ידע בין עובדים סייע לארגונים עתירי ידע לצלוח את תקופת הקורונה. עובדים עבדו מהבית, אך יכלו להיפגש, לגשת לחומרים נחוצים, לעדכן ולהתעדכן מבלי להגיע כמעט למשרד.

כולנו רוצים חזור לשגרה בהקדם, אך מישהו באמת מתגעגע לפקקים הארוכים והמזהמים? אם נמשיך לנהל ידע ולשתף ידע בצורה חכמה, לא כל העובדים יהיו חייבים לעבוד כל הזמן מהמשרד. ייתכן שארגונים יוכלו לוותר על חלק משטחי המשרדים ובעקבות כך בנייני משרדים יוסבו לעירוב שימושים, קרי חלקם יתפנו גם למגורים, מה שיועיל גם לפתרון בעיות הדיור ויהפוך את אזורי המשרדים לנעימים יותר.

כדי לנצל במקסימום גם שטח קטן יותר של משרד, ניתן לחלק משרדים לקפסולות של עובדים שגרים קרוב זה לזה ומגיעים כמה ימים בשבוע למשרד ביחד. אין כמו שיתוף ידע במהלך נסיעה לעבודה וממנה...
כשארגונים מנסים לייצר אצל עובדיהם תחושת משמעות, קשר ותרומה לקהילה, אחת הדרכים לעשות זאת היא לחזק בארגון קיימות והתנהלות ירוקה. כשאנו מדברים על יעילות והתייעלות, בואו נדבר גם על יעילות אנרגטית. בואו נהפוך את הארגונים שלנו לכאלה שנושאים את דגל הקיימות ומובילים במהפכה הירוקה. כשאנו מדברים על קדמה, בואו נדאג שאנו צועדים קדימה לעולם טוב יותר, עבור עובדים ולקוחות, כלל בני האדם והסביבה.

סקירה: מדיה חברתית: סכנה או צורך?

נכתב ע"י פרדי סליבינסקי

יש האומרים שרשתות חברתיות כמו פייסבוק, אינסטגרם או לינקדאין מרתקות, הכרחיות ואף חיוניות כיום. אחרים מחשיבים אותם כמיותרות, מסוכנות ועם השפעות רעות על האנשים. האמת היא שמאז שהם הופיעו בחיינו, העולם השתנה, אך לפעמים קשה לאנשים להסתגל לשינויים ולחיות איתם.

ברור לכולנו שיש המון היתרונות ברשתות החברתיות ושהם הגיעו לחיינו לטובה. הם הגיעו לחיינו כדי לגרום לנו להרגיש חלק ממשהו גדול, כדי לגרום לנו להיות יותר מחוברים אחד לשני או לעזור לנו בחיי היום יום שלנו, אבל אם לא יטופלו בזהירות ועם קצת תבונה או ביקורת, הם יכולות להוביל אותנו למקומות מאד לא טובים. מקומות בהם האנשים מושפעים לרעה מהכח העצום שיש למפלצות האלה.
המדיה החברתית שומרת עלינו בקשר עם "העולם האמיתי". "עולם אמיתי" שהוא לא תמיד הכי אמיתי שיש. כשאנחנו נכנסים לרשתות החברתיות, אנחנו מרגישים מעודכנים בכל מה שקורה סביבנו, אנחנו מרגישים שאנחנו במקום הנכון, בזמן הנכון, איפה שהכל קורה, איפה שכל החברים שלנו נמצאים. האמת, שזה נראה כמו המקום הכי טוב להיות בו.
למשל, בהרבה ארגונים וחברות משתמשים ברשתות החברתיות כדי לתקשר עם הלקוחות או עובדים שלהם. מן ערוץ ישיר שבו ניתן להעביר מידע, לדון, לשתף או סתם לדבר ולצחוק.
אבל בעצם מה שקורה זה שהרשתות החברתיות מבודדות אותנו מהחברים שלנו, מהסביבה שלנו, כי למה שנרצה לצאת מהמקום הכל כך נוח הזה?

קיימים הרבה אנשים שמצליחים לנצל את הרשתות החברתיות לטובה, שמצליחים להקים עסקים, להיות בקשר עם משפחה רחוקה או להרגיש חלק מקהילה, אבל בסופו של דבר חשוב לזכור שלרשתות החברתיות יש האינטרס, הם עסק של חברות בינלאומיות ענקיות, שכל מה שהם רוצות זה להרוויח כסף על חשבוננו ולגרום לנו להיות תלויים בהן.
האם יש תושבה לשאלה "מדיה חברתית: סכנה או צורך?" לא כל כך...

בסופו של דבר הרשתות החברתיות הגיעו לחיינו כדי שנהנה מהם, כדי שנהנה מהעולם החדש והמרגש הזה. אך יחד עם זאת, בואו לא ניפול בטעות של להאמין לכל מה שנאמר או מתפרסם ברשתות החברתיות, בואו לא ניפול למקומות לא טובים שאחר-כך יהיה קשה לצאת מהם.

מקורות:

https://jacetaniaexpress.com/las-redes-sociales-peligro-o-necesidad-articulo-de-opinion-de-juan-jose-mairal/
https://www.elsevier.es/es-revista-revista-medica-clinica-las-condes-202-articulo-impacto-redes-sociales-e-internet-S0716864015000048

טיפ: גרפים.. לא תמיד תמונה שווה יותר מאלף מילים

נכתב ע"י ד"ר מוריה לוי

כולנו אוהבים גרפים. כשאנחנו משלבים אותם בהצגה או מאמר, אנחנו מרגישים חכמים יותר, מקצועיים יותר, ובכלל, אנו מאמינים יותר למה שאנחנו רוצים להגיד, ומקווים שכך גם השומעים/קוראים אותנו.

אלא, שזה לא תמיד המצב. נכון שלגרפים יש פוטנציאל להוסיף נופך מקצועיות לתוכן ולמי שמאחוריו, אלא שיותר מידי פעמים אנחנו פשוט לא עושים זאת נכון וממצים את הפוטנציאל.

חיברנו כאן כמה טיפים לשימוש בגרפים. קצרים, פשוטים וקלים ליישום:

1. תלת ממד:
גרפים של תלת ממד, ובמיוחד עמודות תלת ממד, נתפסים בעיני רבים מאתנו כיותר יפים מהגרפים הרגילים השטוחים.
דוגמה-

ההמלצה- לא!! אסור להשתמש בהם; אף פעם.
למה? המוח מתקשה לקלוט אותם ולהעריך את הגובה המשוקף בכל עמודה.
חשבתם על זה פעם? מאיפה מודדים את הגובה? מהצלע הקדמית? ממרכז העמודה? ואולי מחלקה האחורי? לא משנה מה התשובה, המוח שלנו לא יודע איך לפרש.
מה עושים? פשוט משתמשים בגרף המקביל ללא תלת ממד.

2. אחד אחד:
פעמים רבות אנחנו רוצים להציג שתי התנהגויות שונות של אותו משתנה.
מה עושים? שמים שני גרפים יחד, עם אותו ציר X (המייצג את המשתנה), משרטטים שני גרפים באותו שטח, כאשר לאחד שמים ציר Y עם ערכים מימין, ולשני משמאל (ואלו מייצגים את ההתנהגויות).
דוגמה-

ההמלצה- שוב, לא!

למה? ראשית כי קשה לנו לשייך את הגרף למקרא המתאים (ימין או שמאל); ושנית- כי להצטלבות אין באמת משמעות ודווקא היא הדבר הבולט ביותר בגרף.
מה עושים?
משקיעים בשני גרפים, ושמים זה תחת זה.

3. סקאלה (יחידת מידה):
לעיתים אנחנו רוצים להראות שינוי כמותי, וזה נמצא בטווח מסוים. למשל- עלייה הדרגתית של מכירות מ 120 ל 150 ל 160. מפתה להתחיל את הסקאלה ממספר הקרוב לגבול הראשון- נניח 100, ולא להתחילו מ- 0.
דוגמה-

לא טוב!
למה? כי המוח מעוות את היחס בין הנדלים. גם אם היה גידול ב 10% הוא יכול לפרשו כהכפלה, למשל.
מה עושים? מתחילים בכל זאת מ- 0, או לחילופין מציגים גרף שמדבר על פערים ולא על גדלים. אגב, כאשר מדובר בשנים ולא בכמויות אין כלל בעיה להתחיל את בגרף מכל שנה שהיא, שכן אין פה יחסים בין המספרים השונים.

עוד כמה דגשים שכדאי לתת עליהם את הדעת:
ראשית, השתמשו בצבעים על בסיס גלגל הצבעים, וכאשר את רוצים להבליט ניגודיות בין נתונים- הנגידו אותה גם בצבעים.
בנוסף, היות וגרפים הם לא טקסטים, אנחנו לא קוראים אותם מימין לשמאל ומלמעלה למטה, אנחנו מתחילים ממה שהכי בולט. שימו לב כשאתם מסתכלים על גרף שהכנתם- מה הכי בולט ויזואלית, והאמנם זה המסר שאתם רוצים להדגיש.
ואולי הכי חשוב- פשטות. מסר מרכזי אחד לכל גרף. לא יותר.

בסופו של יום אנחנו (רק) בני אדם. קחו זאת בחשבון.

מאמר מהעולם: מאמר מהעולם

נכתב ע"י ד"ר מוריה לוי

מאמר מעניין על ניהול ידע לטובת ניהול משברים בארגוני בריאות בהקשר לCOVID19-

https://www.tandfonline.com/doi/full/10.1080/14778238.2020.1860665

בלוג: אוסף פוסטים המארח אורחים שונים ומציע מתודולוגיות

https://www.kminstitute.org/blog

סרטון: חדשנות עם ד״ר מוריה לוי- מפיתוח ידע ועד טרנספורמציה

https://www.youtube.com/watch?v=01TTcQRysxQ

כנסים: כנסים- יוני 2021

שם האירוע- International Conference on Knowledge Creation and Management Systems

מיקום האירוע- New York

תאריך: 03-04.06.2021

לפרטים נוספים: לחצו כאן

ספר: Machine Learning for dummies

נכתב ע"י ד"ר מוריה לוי

הספר Machine Learning for dummies הוא ספר בסדרת ספרים המלמדת יסודות של תחומי דעת שונים. הספר שהופק בחסות IBM, נכתב בשנת 2018 על ידי Judith Hurwitz, בבעלותה חברת ייעוץ בתחום, יחד עם אחד עובדיה- Daniel Kirsch. לטעמי, Hurwitz ו- Kirsch עשו עבודה מצוינת בהנגשת הידע הראשוני של תחום זה, גם להדיוטות, בדרך קלה ונעימה לקריאה ועם זו מלמדת ומחדשת.

הספר כמובן כולל הרבה יותר מהמתואר כאן, ומוצג באופן הדרגתי כמו בצל- כל פעם שכבה נוספת מעמיקה יותר.
לכל מי שרוצה להכיר את התחום- זהו ספר מומלץ ביותר- רוצו לקרוא.
IBM מאפשרת גישה חינמית בכתובת: https://www.ibm.com/downloads/cas/GB8ZMQZ3 . שווה!

להלן מפת הספר:

מהי למידת מכונה?

למידת מכונה היא תצורה של בינה מלאכותית המאפשרת למערכת ללמוד מנתונים, במקום להתבסס על תכנות מפורש.
הלמידה עושה שימוש במגוון אלגוריתמים שבאופן איטרטיבי לומדים מהנתונים איך לשפר, לתאר את הנתונים ולחזות תוצאות. ככל שמאמנים יותר את המכונה בנתונים נוספים, ניתן ליצור מודלים מדויקים יותר.
למידת מכונה (machine learning) היא חלק מדיסציפלינה הבינה המלאכותית (artificial intelligence), ומחשוב קוגניטיבי (cognitive computing) בו עושים שימוש במודלים ממוחשבים כדי לחקות את תהליכי הפעולה האנושיים במצבים מורכבים, כאשר התוצאות יכולות להיות בלתי משמעיות ולא ודאיות.
בצד למידת המכונה יש בבינה מלאכותית שלושה כלים משלימים (שלעיתים משמשים במשולב עמה):

א. הסקה סיבתית (reasoning)- מתן סיבתיות להחלטות/המלצות הבינה

ב. עיבוד שפה טבעי (natural language processing- NLP)- פיצוח שפה טבעית בטקסט אט בקול

ג. תכנון (planning)- יצירה עצמאית אוטומטית (ממוכנת) של סדרת פעולות להשגת יעד, בהתאם להקשר.

עד לפני הופעת למידת המכונה הייתה הבינה המלאכותית בעיקרה סיבתית (reasoning),

מבוססת חוקים עסקיים (business rules) (מ.ל.). אחד המאפיינים המשמעותיים של בינה מלאכותית

הינו היותו מבוסס על מודלים סטטיסטיים,

המסייעים גם להבין מאפיינים קיימים של הנתונים, אך גם לחזות על בסיס ניתוחים אלו (predictive analytics).

יכולות אלו מזכירות יכולות של תחום כריית הנתונים (data mining),

אך בעוד, בכריית נתונים יש הסתפקות בזיהוי המאפיינים והדפוסים החוזרים ככלי לסיוע בהחלטות,

הרי שבלמידת מכונה יש אוטומציה של התהליך של זיהוי הדפוסים המשמשים לחיזוי.

שלוש קטגוריות מרכזיות של למידת מכונה:

א. למידה מפוקחת (supervised learning)

יש ידע מקדים לגבי מבנה הנתונים ותכניו

כאשר המאפיינים רציפים נשתמש באלגוריתמים של regression; בדידים- classification

ב. למידה לא מפוקחת (unsupervised learning)

כמות גדולה של הנתונים לא מתויגת (למשל- שיח ברשת)
למידת המכונה מחפשת דפוסים בנתונים ומסווגת/מתייגת את התכנים, בהתאם להקשר
דוגמת שימוש: איסוף מידע על מחלה/ חיידק

ג. למידה מתגברת (reinforcement learning)

המכונה לא מאומנת כשלב מקדים, אלא לומדת מניסוי, משוב והתקדמות
דוגמת שימוש: פעילות רובוטים; משחק

למידה עמוקה (deep learning) היא מתודה ספציפית של למידת מכונה, המשלבת לפחות 3 רמות של רשתות

נוירונים (neural networks), רמת קלט, רמות נסתרות ורמת פלט, בסביבת הלמידה.
למידה עמוקה משלבת למידה מפוקחת ולמידה שאינה מפוקחת.
דוגמאות: זיהוי תמונות, זיהוי שבר מקדים (לטיפול תחזוקתי מניעתי יעיל בציוד).

חזרה

נתונים

נתונים הם בסיס מרכזי בלמידת מכונה.
מקורות הנתונים מגוונים, במספר ממדים:

פנים ארגוניים / חוץ ארגוניים
מובנים (מערכות תפעוליות) / אינם מובנים (תוכן ברשתות חברתיות)
מרובים (לדוגמה מסנסורים) / מורכבים (סרטי וידאו)

למידת מכונה מתבססת על נתוני עתק (big data), נתונים המתאפיינים בארבעת ה- V, כולם את חלקם:

Volume- היקפים עצומים של נתונים
Velocity- מהירות הנדרשת בהעברת הנתונים
Variety- מקורות נתונים מגוונים ומתרחבים כל העת
Veracity- אמיתות של נתונים המייצגים יחד מציאות

הרעיון המסדר הוא ששילוב מאפיינים אלו גורמים לכך שדרכי מחשוב מסורתיים

אינם מספקים עוד לטובת יכולת התמודדות חכמה עם הנתונים, ולכן נדרשות תפיסות העבודה המחדשות,

במרכזן למידת המכונה (מ.ל.). למידת מכונה אינה מחייבת נתוני עתק, אולם נתוני עתק הם בסיס לשיפור ודיוק המודלים.

אתגרים:

נתונים לא מדויקים
נתונים לא מייצגים דיים
נתונים לא מטויבים
היקף נתונים מספק כדי לאפשר למידה
נתונים שניתן לדעת/להבין את הקשרם (עץ בלי עלים בחורף- הקשר מצוין; בקיץ- חולה)
סינון נתונים שנראים כרעש אך מעידים על שינוי מגמה
שימוש בנתונים ספציפיים, המוביל להתאמת יתר (over fitting) של המודל
הוספת מאגרי מידע ונתונים נוספים שיכולים אכן לתרום למודל
חזרה

אלגוריתמים

אלגוריתמים הם אוסף הוראות למחשב המנחות כיצד לטפל בנתונים. באופן טבעי הם יכולים להיות פשוטים מאד,

או מורכבים מאד, בהתאם לאופי המשימה ודרך מימושה.

משפחות שונות של אלגוריתמים מסייעות ללמידת מכונה לצרכים עסקיים שונים,

ולשלבים שונים בלמידה. קיימות כיום ספריות מוכנות הכוללות אלגוריתמים רבים,

וחשוב לדעת לבחור את המשפחות הנכונות לצורך,

ובתוכן את האלגוריתמים המיטביים. כתיבת הקוד בדרך כלל מתבצעת באחת מהשפות: R, Python, Java.
בלמידת מכונה, האלגוריתמים משפרים את ביצועיהם ככל שהם נחשפים ומטפלים ביותר נתונים.
בחירת האלגוריתם הנכון הינו תהליך שחלקו מובנה ומדעי, וחלקו פחות.
משפחות אלגוריתמים מרכזיים:

• באסיאניים (Bayesian): מסייעים לפצח איך נראה המודל,
ללא תלות במה שנראה על פני השטח. שימושיים במיוחד במציאות של חסר בנתונים.

• אשכולות (Clustering): הבנת אובייקטים על ידי שיוכם
לאשכולות שונים בהתאם לטיבם. שימושיים כאשר אין תיוג.

• עצי החלטה (Decision trees): אלגוריתמים המבנים תוצאות בדרך
היררכית של עצים, כאשר לכל עלה בעץ מוצמדת סבירות באחוזים לציון סיכויי מימושו.
שימושי כאשר למשל רוצים להחליט מה הסבירות של אוכלוסיות שונות לנהוג בדרך מסוימת.

• צמצום ממדיות (Dimensionality reduction): אלגוריתמים המסייעים
לצמצום עודף מידע, שאינו תורם למודל. שימושי למשל

ב IOT כאשר סנסורים רבים מפיקים מידע, ומספיק חלק מהמידע לניתוח נתוני ביצועים.

• מבוסס מופעים (instance based): התאמת נתונים חדשים בהתבסס על קרבה

לנתונים אחרים שעברו אימון. מתאים כאשר הנתונים עם שונות אקראית
או יש בהם חוסר חלקי. מסייע לזיהוי דפוסים ושימושי בתחומי הניתוח הביולוגי, כימי והתרופתי.

• רשתות נוירונים ולמידה מעמיקה (neural networks and deep learning):
חיקוי פעולת המוח, ברמה אחת או מספר רמות של רשתות נתונים המקושרות ביניהם.

בלמידה עמוקה- לפחות 3 רמות.

• רגרסיה ליניארית (linear regression): ניתוח סטטיסטי כדי ללמוד
על קשרים בין נתונים. נפוץ מאד בשימוש בלמידת מכונה.
זהירות: מחייב הקשר, למניעת תוצאות מטעות.

• רגולציה (regularization) למניעת התאמת
יתר: טכניקה לשינוי מודלים ומניעת בעיית התאמת יתר.

• למידת מכונה מבוססת חוקים עסקיים (rule based):
שימוש בחוקים עסקיים לתיאור התנהגות המכונה.

דוגמאות טיפוסיות:

א. חיזוי מגמות (למשל שינוי העדפות לקוח, שימור לקוחות):

classification statistical algorithms such as logistic regression and neural networks.

ב. זיהוי פנים (למשל באיתור דמויות במצלמות אבטחה): deep learning algorithms and neural network algorithms

. Image analytics לאינדוקס וחיפוש מול סדרת סרטים תוך סיווג לקטגוריות שונות של עצמים.

ג. חיזוי שבר (למשל לתחזוקה מניעתית): regression algorithms- מתאים מאד בגלל היקף התכנים

של הסנסורים השונים (IOT) וההתייחסות הרציפה אליהם ולזמן הנכון לתחזוקה.

בדרך דומה ניתן גם לנתח רשתות וקונפיגורציות מחשוב ולזהות דפוסים למדדי ביצועים טובים של הסביבה.

ד. זיהוי הונאות (Fraud): היות ומדובר במשימה מורכבת, משלב על פי רוב מספר סוגי אלגוריתמים

לרבות טכניקות ליניאריות ולמידה עמוקה מבוססת רשתות נוירונים. ההונאות השכיחות 20-80 תזוהינה

בדרך כלל על ידי כלים ליניאריים, בעוד ליתר, יופעלו כלי למידת המכונה האחרים.

הערה: יש כיום כלים מוכנים המסייעים בבחירה (לפחות חלקית) של האלגוריתמים המתאימים לשימוש.

חזרה

מודלים

מודל של למידת מכונה הוא המענה המוצע לבעיה עסקית- הנתונים הנבחרים, האלגוריתמים המופעלים עליהם והתהליך המבוצע להפקת התוצאות.
בכל פרויקט למידת מכונה, בוחרים נתונים ועליו בונים מודל המיישם שילוב אלגוריתמים לפתרון הבעיה העסקית בהתאם להקשר. בהמשך המכונה תאומן (trained) ותוכל להתחיל להפיק תובנות שהארגון יכול ללמוד מהן.

אתגרים:

בחירה נכונה של אלגוריתמים בהתאם לבעיה העסקית ואופי הנתונים
בחירה מיטבית של אלגוריתמים שפועלים, כדי לשקלל ביצועים ותובנות מיטביות
מודלים שמתפקדים טוב מידי בגלל התאמת יתר
הטיות
הסתמכות על מודלים סטטיסטיים ללא הבנת ההקשר
אי התאמת המודל לשינויי המגמה, שלא נלקחים בחשבון, בתהליך הלמידה

חזרה

תהליך העבודה

תהליך העבודה בלמידת מכונה כולל:

א. גיבוש מודל

א. זיהוי נתונים רלוונטיים בתוך ומחוץ לארגון, ובחירתם לשימוש

ב. הבטחת משילות: החלטה על דרך שמירת המידע ואבטחתו למניעת שימוש לא נאות במידע פרטי, רגיש או מסווג

ג. טיוב נתונים

ד. בחירת אלגוריתמים

ב. אימון המכונה

ייצוג: הפעלת האלגוריתם על כמות גדלה והולכת של נתונים
הערכה: הערכת מודלים שונים שנוצרו, על ידי אדם או מכונה, לבחירת המדויקים

ה. אופטימיזציה: אופטימיזציה של האלגוריתמים בשימוש בהתאם לביצועים

הערה: מחייב היקף נתונים רב. ככל שהאלגוריתם ייחשף ליותר נתונים, ניתן למצוא מודל מתאים מוכלל יותר.

ג. יישום
יישום למידת המכונה על הבעיה האמתית במציאות העסקית.

ד. חיזוי
הפעלת המכונה על נתוני אמת ולמידה מהתוצאות המתקבלות.

ה. הערכה

הערכת הביצועים; עדכון תהליך הלמידה המחזורי לשיפור הביצועים.

חזרה

התנעת פעילות למידה בארגון

התנעת פעילות למידת מכונה בארגון כוללת:

א. הכשרת הצוות (לא ממליצים להסתמך רק על מומחים מבחוץ),

לרבות לימוד שפות התכנות, חשיפה לאלגוריתמים, הבנת עולם ההסתברויות והסטטיסטיקה, ניהול נתונים, מחזור החיים.

ב. לימוד והבנה כיצד למידת מכונה יכולה לסייע בארגון, ברמה כללית (למידה מארגונים אחרים- מ.ל.)

ג. מיקוד בבעיה עסקית לקידום

ד. זיהוי מקורות מידע נסתרים היכולים לסייע

ה. ביצוע פיילוט: תחילת יישום כאמור בתהליך העבודה לעיל. הערכתו.

ו. החלטה על צעדי המשך ודרך התרחבות ארגונית.

דגשים:
חשוב להסתכל על כלל המידע הארגוני, תוך שבירת ה silos המקובלים בין יחידות
למידת מכונה מחייבת עבודה שיתופית
יש מקורות מידע רבים ללימוד תחום זה של למידת מכונה. בספר יש רשימה של מקורות שכאלו והפניה אליהם.

חזרה

מגמות עתידיות

כותבי הספר מציגים, בעת כתיבתו בשנת 2018, 10 מגמות שמתחילות להתממש, ו/או נראה שכך יקרה בקרוב:

א. שילוב של למידת מכונה ברוב האפליקציות המשמשות אותנו.

ב. שימוש בנתונים שכבר עברו אימון כשירות שניתן לרכוש.

ג. שילוב יתר מודלים בסביבות חיות, עם ממשק משתמש (כיום רוב המודלים משמשים offline).

ד. שימוש הולך וגובר בלמידת מכונה כשירות שניתן לצרוך (מוכן).

ה. הבשלת פתרונות עיבוד שפה טבעי (NLP).

ו. הגברת האוטומציה בתהליכי למידת מכונה, תוך הפניית העובדים למשימות מורכבות יותר.

הנ״ל יהיה במספר מרכיבים, לרבות בכל הקשור בתצוגה ברורה וטובה של נתונים (data visualization).

ז. חומרה ייעודית שתשפר את ביצועי למידת המכונה.

ח. אוטומציה של תהליכי בחירת האלגוריתמים ותהליכי אימון הנתונים.

ט. הגברת השקיפות של תוצאות והמלצות המכונה ובזכות זה, הגברת האמון של העובדים והמנהלים בהמלצות אלו.ֿ

י. למידת מכונה כתהליך קצה אל קצה (כיום משמש בעיקר למשימות חלקיות בתוך התהליך).

חזרה

המגזין נכתב ע"י חברת Rom Knowledgeware

Fax 077-5020772 * Tel 077-5020771/3 * רח' בר כוכבא 23, בני ברק מיקוד 67135