מנועי חיפוש

איש חכם אחד פעם אמר:

"כשם שהעיסוק בבעיית הרעב, בתחילת המאה העשרים, התחלף בעיסוק מסיבי בתזונה נכונה ודיאטות בסופה של המאה, כך בעיית חוסר המידע בתחילת שנות השמונים התחלף, לקראת סוף שנות התשעים, בבעיה לא פחותה של הצפה ועודף מידע."

אנו מתעדים כיום הרבה. אמנם לא תמיד את הכול, אמנם לא תמיד את כל הדברים הנכונים, אך בהחלט שטחי דיסקים נרחבים יותר ויותר מוקדשים לאחסון מסמכים ופריטי תוכן אחרים.

התיעוד הרב מביא אותנו מהר מאד לבעיית התמצאות. לבעיה באיתור פריטי תוכן, המתעדים ידע חשוב, שבטוח קיים אי שם. הידע החשוב כל כך, הקיים בראשם של אנשים, לעיתים מתמקד בהיכן נמצא המסמך המתעד את הידע, לא פחות, מ-מהו הידע עצמו.

אחד האמצעים הטכנולוגיים המסייעים לנו באיתור ידע מתועד זה, הנו מנוע החיפוש הארגוני. רכיב של מנוע חיפוש קיים בהרבה מערכות שונות הקיימות בארגון, אך אלו ייעודיים, וארגונים רבים יותר ויותר מבקשים לעצמם מנוע חיפוש כללי.

מנועי חיפוש רבים קיימים בשוק. טוב, אך מבלבל. הסיבה לכך נעוצה בכך, שכל קבוצה אקראית של מנועי חיפוש שנבחן, מכילה על פי רוב מוצרים שהחפיפה והתחרות ביניהם קטנים ביותר. במילים אחרות, זה מוכר ספרים והשני עיתונים. אולם למרות שבשניהם

יש דפים, השוני רב.

כדי להבין איזה כלי נחוץ לנו ביותר בארגון (הכול נחוץ, אך המשאבים לעולם לא מספקים..) יש להקדים ולהבין את סוגי היכולות המקבלים מענה ע"י מנועי חיפוש. אלו מתוארים בתרשים הבא:

 

הסבר:

א. צבעים:

רכיבים הצבועים בכתום מאפשרים הרחבת כמות התוצאות. לדוגמא: יכולת העבודה עם תזארוס, מאפשרת בעת חיפוש המילה "מטוס" גם להגיע למסמכים המכילים "אווירון" (מילה נרדפת) וגם להגיע למסמכי "לביא" (יחס אב-הורה).

רכיבים הצבועים בצהוב מאפשרים צמצום כמות התוצאות ו/או ארגונם לצורך התמקדות. לדוגמא: יכולת ה- Text Mining תנפה בעת בקשת מסמכים הקשורים בחברת Smith, מסמכים ותכנים הקשורים לחברה, אך לא לאדון Smith. זאת, על סמך ניתוח הקשרים בתוך המשפט בו כתוב הטקסט. האם נוסף לו התואר בע"מ, או התואר אדון/גברת, וכדומה.

רכיבים הצבועים בסגול קשורים בממשקים של מנוע החיפוש למערכות אחרות. לדוגמא: ה- API's מאפשרים הפעלת פונקצית החיפוש מתוך מערכות IT תפעוליות.

רכיבים הצבועים בירוק, אינם רכיבים עצמאיים, אלא תשתיות חשובות להצלחתו של כל מוצר תשתיתי. לדוגמא: מנגנון הרשאות טוב, יודע לדמות עצמו למשתמש (ברמת ההרשאות המותרות) כאשר הוא מבקש לחפש ולאחזר מידע ממקורות שונים בארגון, ועל סמך הרשאותיו של המשתמש לכלול / להתעלם מהתוצאות שהתקבלו. נשמע טריוויאלי, אך רחוק מכך במציאות.

ב. מיקומים:

הרכיבים הממוקמים באזור השמאלי של התרשים רלוונטיים בעת הגדרת המילים עליהן יתבצע החיפוש (לפני הגישה לתכנים השונים).

הרכיבים הממוקמים באמצע, רלוונטיים בעת עיבוד התוצאות שהתקבלו מהתכנים השונים, לקראת הבאתם חזרה למשתמש.

הרכיבים הממוקמים מימין קשורים בעולם החיצון של תכנים, המגיעים, מחוץ למאגר המרכזי בו מבוצע החיפוש.

הרכיבים בחלק העליון קשורים לממשק עם המשתמש. העננים קשורים בתשתיות.

ג. משפחות מוצרים:

רוב המוצרים מיצגים בעיקר שניים שלושה רכיבים, שהם מרכז הכובד של יכולותיהם. אי לכך, קיימת חפיפה חלקית בין המוצרים. משפחות המוצרים העיקריות מתמקדות ב:

אחזור לשוני (Lingual).

חיפוש משולב (Federated Search).

חיפוש חכם / כריית מידע (Text Mining)

מוצרי קטלוג (Auto Categorization/Categorization)

 

קצרה היריעה מלהרחיב כאן על כל הרכיבים, אך יש כאן בהחלט יריית פתיחה. לפרטים נוספים ניתן לפנות לעורכי העיתון.