איך פועלים האלגוריתמים של החיפוש

בגלל כמויות המידע העצומות באינטרנט, כמעט בלתי אפשרי למצוא את מה שאתם צריכים ללא עזרה במיון המידע. מערכות הדירוג של Google מיועדות למטרה זו בדיוק: הן ממיינות מאות מיליארדי דפי אינטרנט באינדקס החיפוש כדי למצוא את התוצאות הרלוונטיות והשימושיות ביותר בתוך שבריר שנייה, ומציגות אותן באופן שיעזור לכם למצוא את מה שאתם מחפשים.

מערכות הדירוג האלו מורכבות מסדרה שלמה של אלגוריתמים. כדי להעניק לכם את המידע השימושי ביותר, האלגוריתמים של החיפוש בוחנים גורמים רבים, כולל המילים שבחיפוש שלכם, נוחות השימוש ורמת הרלוונטיות של הדפים, רמת המומחיות של המקורות וגם המיקום הפיזי וההגדרות שלכם. המשקל שניתן לכל גורם משתנה בהתאם לסוג החיפוש. לדוגמה, מידת העדכניות של התוכן חשובה במענה על שאילתות חיפוש לגבי הנושאים העכשוויים בחדשות, ופחות בהקשר של הגדרות מילוניות.

כדי להבטיח שהאלגוריתמים של החיפוש יעמדו בסטנדרטים גבוהים של רלוונטיות ואיכות, יש לנו תהליך קפדני שכולל בדיקות בזמן אמת וגם אלפי גופי דירוג חיצוניים של איכות החיפוש מרחבי העולם. מדרגי האיכות האלו פועלים לפי הנחיות קפדניות שזמינות לקהל הרחב ומגדירות את היעדים שלנו לאלגוריתמים של החיפוש.

מה עוזר לנו לקבוע אילו תוצאות יוצגו בעקבות החיפוש שלכם? אלה הגורמים העיקריים:

  • ניתוח מילות החיפוש

    ניתוח מילות החיפוש

    כדי שנוכל להציג לכם תוצאות רלוונטיות, אנחנו צריכים להבין איזה מידע אתם מחפשים – מהי הכוונה שמאחורי החיפוש. כדי להבין את הכוונה, צריך קודם כול להבין את השפה, ולשם כך אנחנו בונים מודלים של שפה שמטרתם לנסות ולפענח אילו רצפי מילים עלינו לחפש באינדקס.

    ניתוח מילות החיפוש כולל פעולות פשוטות לכאורה, כמו פענוח שגיאות איות, אך גם אתגרים מורכבים כמו ניסיון להבין את סוג החיפוש שלכם בעזרת יישום תובנות ממחקרים עדכניים לגבי הבנת שפה טבעית. לדוגמה, מערכת המילים הנרדפות שלנו עוזרת לשירות החיפוש להבין למה אתם מתכוונים, על סמך העובדה שלכמה מילים יכולה להיות משמעות זהה. פיתוח המערכת הזו נמשך יותר מחמש שנים, והיא משפרת באופן משמעותי את התוצאות ביותר מ-30% מהחיפושים בשפות השונות.

    אנחנו גם מנסים להבין מהי קטגוריית המידע שאתם מחפשים. האם זה חיפוש ספציפי מאוד או כללי? האם יש בחיפוש מילים כמו "המלצות", "תמונות" או "שעות פתיחה" שמצביעות על צורך במידע ספציפי? האם אתם מחפשים מילות מפתח פופולריות שמרמזות על כך שאתם מעוניינים בתוכן שפורסם באותו יום? או שאולי אתם מחפשים עסק שנמצא בסביבה שלכם ורוצים לקבל עליו פרטים?

    מאפיין חשוב במיוחד בסיווג השאילתה הוא הניתוח שלנו שבודק אם אתם מחפשים תוכן חדש. אם אתם מחפשים מילות מפתח פופולריות, אלגוריתמי העדכניות שלנו יפרשו זאת כסימן לכך שמידע עדכני יהיה כנראה שימושי יותר מדפים ישנים. זה אומר שכשתחפשו את "תוצאות ליגת העל בכדורגל", "התוצאות של הכוכב הבא" או "מניות טבע", תקבלו את המידע העדכני ביותר.

  • מציאת התאמות לחיפוש

    מציאת התאמות לחיפוש

    בשלב הבא, אנחנו מחפשים דפי אינטרנט עם מידע שתואם לשאילתת החיפוש. כשאתם מחפשים, האלגוריתמים מחפשים באינדקס את מונחי החיפוש כדי למצוא את הדפים המתאימים. הם מנתחים את התדירות והמיקום שבהם מילות המפתח האלה מופיעות בכל דף, בין אם מדובר בכותרות או בגוף הטקסט.

    הסימן הבסיסי ביותר לכך שהמידע רלוונטי הוא כשדף האינטרנט מכיל את אותן מילות מפתח שנכללות בשאילתת החיפוש שלכם. אם מילות מפתח אלה מופיעות בדף, או שהן מופיעות בכותרת או בגוף הטקסט, סביר יותר להניח שהמידע רלוונטי. מעֵבר להתאמה פשוטה של מילות מפתח, אנחנו משתמשים בנתוני אינטראקציה מצטברים ואנונימיים כדי לבדוק אם תוצאות החיפוש רלוונטיות לשאילתות החיפוש. אנחנו הופכים את הנתונים האלה לאותות שמסייעים למערכות הלמידה החישובית שלנו להעריך טוב יותר את מידת הרלוונטיות.

    בנוסף להתאמת מילות מפתח, האלגוריתמים בוחנים גם רמזים כדי להעריך מהי מידת התועלת של תוצאות חיפוש פוטנציאליות למשתמשים. כשאתם מחפשים את המילה "כלבים", למשל, אתם ודאי לא מעוניינים בדף שבו המילה "כלבים" מופיעה מאות פעמים. אנחנו מנסים להבין אם הדף מכיל תשובה לשאילתה שלכם, ולא רק חוזר על המילים שמופיעות בה. האלגוריתמים של החיפוש בודקים אם הדפים כוללים תוכן רלוונטי – כמו תמונות או סרטונים של כלבים, או אפילו רשימת גזעים. לסיום, אנחנו בודקים אם הדף כתוב בשפה של שאילתת החיפוש כדי לתת עדיפות לדפים בשפה המועדפת עליכם.

    חשוב לציין שאף על פי שהמערכות שלנו מחפשות אותות כאלה שניתנים לכימות כדי להעריך את הרלוונטיות, הן לא נועדו לנתח קונספטים סובייקטיביים כמו נקודת המבט או הנטייה הפוליטית של תוכן הדף.

  • איכות התוכן

    איכות התוכן

    שאילתת חיפוש רגילה יכולה להביא אלפים ואפילו מיליונים של דפי אינטרנט עם מידע שעשוי להיות רלוונטי. כדי שהדפים הטובים ביותר יופיעו במיקום הגבוה ביותר, אנחנו גם מפתחים אלגוריתמים שמעריכים את התועלת של דפי האינטרנט האלה.

    האלגוריתמים האלה מנתחים מאות גורמים שונים כדי לנסות להציג את המידע האיכותי ביותר באינטרנט. בין היתר, הגורמים יכולים להיות עדכניות התוכן, מספר הפעמים שמונחי החיפוש מופיעים בתוכן וחוויית המשתמש בדף. כדי להעריך את האמינות והמהימנות ביחס לנושא הנדון, אנחנו מחפשים אתרים שנראה כי משתמשים רבים העדיפו בשאילתות חיפוש דומות. אם אתרים בולטים אחרים בנושא מקשרים אל הדף, זה סימן טוב לכך שהמידע איכותי.

    יש באינטרנט הרבה אתרי ספאם שמנסים להגיע באופן מניפולטיבי אל ראש תוצאות החיפוש בעזרת טכניקות כמו חזרה על מילות מפתח או קניית קישורים שעוקפים את דירוג הדף. האתרים האלה מספקים חוויית משתמש באיכות ירודה ואפילו עשויים לגרום נזק למשתמשי Google או להטעות אותם. לכן אנחנו מפתחים אלגוריתמים לזיהוי ספאם והסרה של אתרים שמפרים את ההנחיות של Google למנהלי אתרים מהתוצאות שלנו.

    התוכן באינטרנט, יחד עם כל מה שקשור לטכנולוגיית המידע, משתנה כל הזמן. לכן, אנחנו מודדים ומעריכים ללא הרף את איכות המערכות שלנו כדי להבטיח שאנחנו מגיעים לאיזון הנכון בין הרלוונטיות של המידע לבין האמינות שלו. כל זאת כדי לשמור על האמון שאתם נותנים בתוצאות המוצגות לכם.

  • הצגת התוצאות הטובות ביותר

    הצגת התוצאות הטובות ביותר

    לפני שאנחנו מציגים לכם את התוצאות, אנחנו בודקים את ההתאמה בין כל חלקי המידע הרלוונטי: האם יש רק נושא אחד בתוצאות החיפוש, או כמה נושאים? האם יש יותר מדי דפים שמתמקדים בפרשנות צרה אחת? אנחנו משתדלים לספק מידע מגוון בפורמטים המועילים ביותר לסוג השאילתה שלכם. ככל שהאינטרנט מתפתח, אנחנו מפתחים את מערכות הדירוג כדי לספק תוצאות טובות יותר בתגובה למספר גדול יותר של שאילתות חיפוש.

    אלגוריתמים אלה מנתחים אותות שמציינים אם כל המשתמשים שלנו יכולים לראות את התוצאה, כמו למשל, האם האתר מוצג כראוי בדפדפנים שונים; האם הוא מיועד למכשירים מכל סוג ובכל גודל, כולל מחשבים, טאבלטים וסמארטפונים, והאם זמני הטעינה של הדף עובדים היטב למשתמשים עם חיבורים איטיים לאינטרנט.

    מאחר שבעלי אתרים יכולים לשפר את נוחות השימוש של האתר שלהם, אנחנו עובדים קשה כדי ליידע את בעלי האתרים מראש בנוגע לשינויים משמעותיים שניתן לפעול לגביהם, שאנחנו מבצעים באלגוריתמים של חיפוש. לדוגמה, בינואר 2018 הודענו שהאלגוריתמים שלנו יתחילו לשקול את 'מהירות הדף' של האתרים שישה חודשים לפני שהשינויים הושקו. כדי לסייע לבעלי האתרים, סיפקנו הדרכה מפורטת וכלים כמו PageSpeed Insights ו-Webpagetest.org כדי שבעלי האתרים יוכלו לראות מה (אם בכלל) הם צריכים לשנות כדי שהאתרים שלהם יהיו מתאימים יותר לניידים.

    ניתן למצוא מידע נוסף בנוגע לכלים ולטיפים ש-Google נותנת לבעלי האתרים כאן .

  • הקשר והגדרות

    הקשר והגדרות

    בעזרת מידע כמו המיקום הפיזי שלכם, היסטוריית חיפושים והגדרות החיפוש, אנחנו מתאימים עבורכם את התוצאות המועילות והרלוונטיות ביותר לכם באותו רגע.

    אנחנו משתמשים במידע על המדינה והמיקום שלכם כדי לספק תוכן רלוונטי לאזור. לדוגמה, אם אתם בשיקגו ומחפשים את המונח "football‏", Google כנראה תציג תוצאות לגבי פוטבול (ולא כדורגל), וקבוצת Chicago Bears תופיע ראשונה. לעומת זאת, אם תחפשו את המילה "football" בלונדון, Google תיתן עדיפות לתוצאות לגבי כדורגל והפרמייר ליג. הגדרות חיפוש הן עוד סימן חשוב לגבי התוצאות שכנראה יהיו מועילות עבורכם. לדוגמה, אם הגדרתם שפה מועדפת או הבעתם הסכמה לחיפוש בטוח (כלי שעוזר לסנן תוצאות בוטות).

    במקרים מסוימים אנחנו עשויים גם להתאים אישית את התוצאות בעזרת מידע לגבי פעילות החיפוש שלכם בתקופה האחרונה. לדוגמה, אם תחפשו "ברצלונה" ולאחרונה חיפשתם "ברצלונה מול ארסנל", זה יכול להיות רמז חשוב שאתם מעוניינים במידע על קבוצת הכדורגל ולא על העיר. אפשר לקבוע איזו פעילות חיפוש תשמש לשיפור החוויה בחיפוש, וגם לשנות את סוג הנתונים שנשמרים בחשבון Google. אפשר לקבוע את ההגדרות האלה בכתובת myaccount.google.com.

    חיפוש גם כולל מספר תכונות שמתאימות אישית את התוצאות על סמך הפעילות שלכם בחשבון Google. לדוגמה, אם תחפשו "אירועים באזור", Google עשויה להתאים את ההמלצות לקטגוריות של אירועים שאנחנו חושבים שעשויים לעניין אתכם. מערכות אלה נועדו להתאים לתחומי העניין שלכם, אבל הן לא נועדו להסיק מאפיינים רגישים כמו גזע, דת או מפלגה.

    אפשר לקבוע איזו פעילות חיפוש תשמש לשיפור החוויה בחיפוש, וגם לשנות את סוג הנתונים שנשמרים בחשבון Google. אפשר לקבוע את ההגדרות האלה בכתובת myaccount.google.com. כדי להשבית את ההתאמה האישית של החיפוש על סמך הפעילות שלכם בחשבון, כבו את האפשרות 'פעילות באינטרנט ובאפליקציות'.