מגמות בעולם מנועי החיפוש /בינה מלאכותית בשירות מנועי החיפוש
מאת: ענת ביילסקי
מגמות בעולם מנועי החיפוש /בינה מלאכותית בשירות מנועי החיפוש

עולם מנועי החיפוש הולך ומתפתח בשנים האחרונות, זאת בייחוד לאור כניסת יישומי בינה מלאכותית אשר מהווים קפיצת מדרגה משמעותית ליכולות מנועי החיפוש כיום ובעתיד.
אחד מהשיפורים שנעשו בתחום הוא המעבר ממנועי חיפוש המשמשים רק לאיתור מידע מתוך אתרים ומאגרים ל"מנועי תשובות" אשר מספקים למשתמשים תשובות ממוקדות למידע שהם מחפשים.

בהקשר זה, חברת גוגל לדוגמא, משתמשת ב"Knowledge Graph" אשר הינו בסיס יעד מבוסס ישויות ולא מילות מפתח המאפשר להציג כתשובה לשאילתת חיפוש "כרטיס מידע" הכולל מידע רב שקשור סמנטית לישות עליה בוצע החיפוש. גוגל בונה את גרף הידע על בסיס ניתוח שאילתות קודמות שבוצעו ועל בסיס הקשרים בין דפי אינטרנט, ניתוח מאגרי מידע כדוגמת ויקיפדיה, ויקימדיה וספר העובדות העולמי של ה-CIA, Schema.org ואתרים מהימנים נוספים.
מטרתו לייצר תשובות מהירות למשתמשים כך שיוכלו להשתמש במידע זה על מנת לפתור את השאילתא שלהם ללא צורך להיכנס לאתרי אינטרנט על מנת לאתר את התשובה ובכך לקצר את זמן החיפוש תוך הבאת התשובה בדף החיפוש.

לדוגמא: חיפוש המונח AI בגוגל מציג תחילה את פירוש המונח לפני הצגת תוצאות החיפוש על ידי שימוש ב Knowledge Graph.

 

במקרים אלה, הבינה המלאכותית מסייעת למנועי החיפוש להבין את השפה הטבעית של האדם על ידי זיהוי המשמעות הקשורה לכל שאילתה והמידע הנדרש למתן תשובות.

שיפור נוסף הינו פיתוח היכולת של מנוע החיפוש להבין את כוונת המשתמש בשאילתת החיפוש. האתגר בנושא זה נובע מהעובדה כי אנו נעזרים במנועי חיפוש למטרות שונות (קניות, מחקר, איתור מידע ועוד) וכי ישנם מקרים רבים בהם מילת מפתח אחת יכולה להיות בעלת מספר משמעויות, באמצעות ניתוח דפוסי הקליקים וסוגי התוכן שהמשתמש חיפש בחיפושים קודמים מנוע חיפוש יכול למנף למידת מכונה כדי לקבוע את הכוונה מאחורי החיפוש של המשתמש.

כך למשל, חברת גוגל משתמשת ב BERT”" (קיצור של Bidirectional Encoder Representations from Transformers)  שהינו  כלי NLP  שגוגל משתמש בו על מנת  להבין טוב יותר את ההקשר של שאילתת החיפוש של המשתמש ואת הניואנסים והקשרים בין המילים . זאת על ידי פיענוח ולימוד כיצד משתמשים מקיימים אינטראקציה עם התוכן.  בנוסף החברה משתמשת ב " “RankBrainשהינו אלגוריתם למידת מכונה שפותחה על ידי גוגל, שלא רק עוזר לזהות דפוסים בשאילתות המשתמשים , אלא גם עוזר למנוע החיפוש לחזות על איזו תוצאת חיפוש סביר להניח שמשתמש יקליק  עבור שאילתה שלא בוצעה בעבר וגם זאת באמצעות ניתוח נתוני חיפוש היסטוריים.
שימוש נוסף ב "RankBrain" הינו באיתור מילים נרדפות כך שתוצאות החיפוש למשתמש יכולות להכיל רק את המילים הנרדפות המתאימות ולא את מילת החיפוש שהזין המשתמש.

 

אלמנטים נוספים בחיפוש אשר תופסים תאוצה ומתרחבים הינם החיפושים הקוליים והחיפושים הוויזואליים: 
חיפוש קולי
- עם כניסתם של "העוזרים הווירטואליים" Siri, Alexa ודומיהם שאילתות חיפוש קוליות הופכות להיות יותר ויותר פופולריות בקרב המחפשים באינטרנט.
בשנת 2020 גוגל דיווחה כי 20 אחוז מהחיפושים דרך הטלפונים החכמים הינם שאילתות קוליות. שאילתות חיפוש קוליות נעשות ארוכות ומורכבות יותר, גם במקרים אלו כלי ה AI וביחוד כלי עיבוד השפה הטבעית (NLP), יכולים לסייע לנו לאמת את איכות תוכן והן את היכולת של מנועי החיפוש לעבד תוכן מסוג זה.

חיפוש ויזואלי- בכל שניה מועלות סך כולל של  5000 תמונות ברשתות החברתיות פייסבוק ואינסטגרם. כלומר, מאות מיליוני תמונות שמועלות אליהן מדי יום.  שימוש בכליAI  של למידת מכונה מאפשרת ניתוח דפוסי צבע וצורות ומצמידה אותם לכל נתוני הסכימה קיימים לגבי התצלום כל זאת על מנת לעזור לסייע למנוע החיפוש להבין מהי התמונה ומשמעותה. כך לדוגמא, מנוע החיפוש של גוגל מסוגל לא רק לקטלג תמונות עבור תוצאות החיפוש של תמונות  אלא גם המשתמשים יכולים למצוא מופעים אחרים של התמונה באינטרנט, כמו גם תמונות דומות עם אותם נושאים או פלטת צבעים ומידע על הנושאים בתמונה. בנוסף, ניתן גם להפעיל את חיפוש התמונות ההפוך, המאפשר למשתמשים לחפש באמצעות תמונה במקום שאילתת טקסט באמצעות יישומים כדוגמת Google Lens אשר  הופכים  להיות אחד ממגמות השיווק הגדולות ביותר בתחום החיפוש בעתיד הקרוב.

שימוש נוסף שביכולות AI לשיפור תוצאות מנועי החיפוש הוא שימוש בלמידת מכונה לזיהוי תבניות אשר מסייעים באיתור ספאם או תוכן משוכפל. למידת מכונה מזהה את הדפוסים הללו באמצעות למידה ממקרים דומים בעבר על מנת לזהות מתי נעשה שימוש במבנים וטכניקות דואר זבל חדשים, לזהות את הדפוסים החדשים ולסמן אותם כבעיתיים.

כך למשל, למרות שגוגל עדיין משתמשת באנשים לבדיקת איכות התכנים, שימוש בכלי למידת מכונה על מנת  לזהות דפוסים אלו מצמצם באופן דרסטי את כמות כוח האדם הדרושה לבדיקת התוכן.

לסיכום, ניתן לומר כי טכנולוגיות AI כדוגמת למידת מכונה,NLP משנים אט אט את הדרך בה מנועי החיפוש מוצאים ומדרגים את המידע. ככל שהמשתמשים ישתמשו בהם יותר, כך התוצאות שיתקבלו יהיו מדויקות ו"חכמות יותר". עם זאת, חשוב לציין שלמידת מכונה אף פעם לא תהיה מושלמת וכי יש צורך בעובדים אנושיים שיבצעו את הכיוונונים והטיובים שהחברות עושות במנועי החיפוש.

 

 

מקורות:

https://www.artefact.com/news/the-future-of-search-with-artificial-intelligence

https://www.searchenginejournal.com/ml-things-we-know/408882/#close

https://www.europeanbusinessreview.com/how-will-online-search-evolve-in-the-coming-years/

https://he.wikipedia.org/wiki/%D7%92%D7%A8%D7%A3_%D7%94%D7%99%D7%93%D7%A2