Comment fonctionnent les algorithmes de recherche ?

Au vu de la quantité d'informations disponibles sur le Web, il vous serait presque impossible de trouver ce dont vous avez besoin si elles n'étaient pas triées. Les systèmes de classement de Google sont conçus pour cela. Ils trient les centaines de milliards de pages Web de l'index de recherche pour vous proposer les résultats les plus utiles et pertinents en une fraction de seconde, et ils présentent ces derniers de sorte que vous trouviez plus vite ce que vous cherchez.

Ces systèmes de classement sont composés non pas d'un, mais de toute une série d'algorithmes. Pour vous donner les informations les plus utiles, les algorithmes de recherche tiennent compte de nombreux facteurs, tels que les mots utilisés dans votre requête, la pertinence et la facilité d'utilisation des pages, le niveau d'expertise des sources, votre position et vos paramètres. La pondération appliquée à chaque facteur varie en fonction de la nature de votre requête. Par exemple, l'actualisation du contenu joue un rôle plus important dans la réponse aux requêtes concernant un sujet d'actualité que dans le cas de définitions du dictionnaire.

Pour que les algorithmes de recherche répondent aux exigences de pertinence et de qualité, nous appliquons un processus rigoureux comprenant des tests en direct conduits avec l'aide de milliers d'évaluateurs externes du monde entier, dont le rôle est d'analyser la qualité des résultats de recherche. Ces évaluateurs suivent des consignes strictes qui définissent nos objectifs en matière d'algorithme de recherche et peuvent être consultées par tous.

Découvrez ci-dessous les principaux facteurs qui déterminent les résultats renvoyés pour votre requête :

  • Analyse des termes de recherche

    Analyse des termes de recherche

    Pour vous proposer des résultats pertinents, bien comprendre votre requête est essentiel. C'est pourquoi nous devons analyser le sens des termes que vous avez saisis afin d'identifier des pages qui leur correspondent. Nos modèles linguistiques nous permettent de déterminer quelles sont les chaînes de mots que nous devons rechercher dans l'index.

    Pour cela, nous mettons en œuvre de nombreuses techniques, telles que l'interprétation des erreurs d'orthographe (plus complexe que cela n'y paraît), ou encore le traitement automatique du langage naturel, une technique sophistiquée visant à cerner le type de requête saisi. Autre exemple : notre système de gestion des synonymes permet d'analyser votre recherche, même si vous utilisez un mot ayant plusieurs significations. Il nous a fallu cinq ans pour développer ce système, qui améliore sensiblement les résultats pour plus de 30 % des recherches, toutes langues confondues.

    Nous analysons également le genre d'informations que vous recherchez. Votre requête est-elle large ou très spécifique ? Avez-vous saisi des mots comme "avis", "photos" ou "horaires d'ouverture", qui pourraient nous aider à mieux cerner votre demande ? Utilisez-vous des mots clés qui font le buzz, auquel cas cela voudrait dire que vous recherchez un contenu publié le jour même ? Êtes-vous à la recherche d'une entreprise de proximité et souhaitez-vous obtenir des informations locales ?

    L'un des aspects les plus importants de la classification des requêtes consiste à déterminer si celles-ci portent sur un contenu récent. Si vous recherchez des mots clés populaires, nos algorithmes de détection des actualités interpréteront cela comme une incitation à privilégier les informations récentes plutôt que les pages plus anciennes. Ainsi, lorsque vous voudrez connaître le dernier "score de l'OM", les "finalistes de Koh Lanta" ou le "chiffre d'affaires du Groupe Dassault", vous obtiendrez les informations les plus récentes.

  • Recherche de correspondances

    Recherche de correspondances

    Nous recherchons ensuite les pages Web contenant des informations qui correspondent à votre requête. Lorsque vous lancez une requête, nos algorithmes cherchent les termes que vous avez saisis dans l'index afin d'y trouver des pages pertinentes. Ils analysent le nombre de fois que ces mots clés apparaissent sur une page et leur emplacement au sein de cette dernière (dans les titres, les sous-titres ou le corps du texte).

    Le signal le plus simple indiquant la présence d'informations pertinentes dans une page Web est la présence de mots clés figurant dans votre requête de recherche. Si ces mots clés se trouvent sur la page ou apparaissent dans les titres ou le corps du texte, l'information a plus de chances de répondre à vos besoins. Au-delà de la simple identification de mots clés en commun, nous utilisons des données d'interaction globales et anonymes pour évaluer l'intérêt des résultats de recherche en lien avec les requêtes. Nous transformons ces données en signaux qui permettent à nos systèmes de machine learning d'évaluer plus efficacement les niveaux de pertinence.

    Outre les mots clés, les algorithmes recherchent des indices pour mesurer le degré d'adéquation entre les résultats de recherche potentiels et la requête de l'internaute. Par exemple, lorsque vous recherchez le terme "chiens", vous n'avez certainement pas envie que les résultats renvoient une page contenant des centaines d’occurrences du mot "chiens". La page ne doit pas seulement reprendre les termes de votre requête : elle doit vous offrir la réponse souhaitée. C'est la raison pour laquelle les algorithmes de recherche Google déterminent si les pages incluent du contenu pertinent, tel que des photos de chiens, des vidéos, la liste des races de chiens, etc. En dernier lieu, nous vérifions que la page est bien rédigée dans la langue de votre question, afin d'accorder la priorité aux pages rédigées dans votre langue de prédilection.

    Il est important de noter que nos systèmes recherchent ce genre de signaux quantifiables pour évaluer les niveaux de pertinence des pages Web, mais ne sont pas conçus pour analyser des concepts subjectifs, tels que le point de vue ou la tendance politique propres à chaque page.

  • Classement des pages selon leur utilité

    Classement des pages selon leur utilité

    Pour une requête, il existe des milliers, voire des millions de pages Web qui contiennent des informations potentiellement pertinentes. Aussi, afin de proposer les meilleures d'entre elles en premier, nous concevons des algorithmes pour évaluer leur utilité.

    Pour essayer de déceler les meilleures informations possibles sur le Web, ces algorithmes analysent des centaines de facteurs dont le niveau d'actualisation du contenu, le nombre d'occurrences des termes de recherche ou encore l'ergonomie de la page. Pour évaluer le degré de fiabilité et d'autorité d'une page traitant d'un sujet particulier, nous recherchons les sites auxquels le plus grand nombre d'internautes semble accorder du crédit concernant ce même sujet. Le fait que d'autres sites reconnus sur le sujet dirigent les internautes vers une page en particulier constitue également un bon indicateur de la qualité des informations de cette dernière.

    Le Web compte de nombreux sites spammeurs qui tentent d'accéder aux premières places des résultats de recherche à l'aide de techniques comme la répétition en boucle de mots clés ou l'achat de liens qui améliorent le classement PageRank. Ces sites nuisent à l'expérience de navigation des internautes, et peuvent même leur causer du tort ou les induire en erreur. C'est pour cette raison que nos algorithmes sont conçus pour détecter le spam et pour supprimer de nos résultats les sites qui enfreignent nos Consignes aux webmasters.

    Les contenus disponibles sur le Web et l'ensemble de l'écosystème de l'information changent constamment, et nous mesurons et évaluons en permanence la qualité de nos systèmes pour être sûrs de trouver le juste équilibre entre la pertinence et la fiabilité de l'information afin que vous ayez toujours confiance dans les résultats affichés.

  • Affichage des meilleurs résultats

    Affichage des meilleurs résultats

    Avant de vous présenter les résultats, nous évaluons le lien entre toutes les informations pertinentes que nous avons trouvées : les différents résultats traitent-ils d'un sujet en particulier ou de plusieurs ? Un trop grand nombre de pages donnent une interprétation réductrice de la requête ? Nous veillons à proposer un large éventail d'informations, dans les formats qui conviennent le mieux au type de recherche effectuée. Au fur et à mesure des évolutions du Web, nous adaptons nos systèmes de classement afin de renvoyer des résultats de meilleure qualité.

    Ces algorithmes analysent des signaux qui indiquent si tous nos utilisateurs bénéficient d'une présentation satisfaisante du résultat, par exemple si un site Web s'affiche correctement dans différents navigateurs ; s'il est adapté à tous les types et tailles d'appareils (des ordinateurs de bureau aux tablettes et autres smartphones) ; et si les temps de chargement des pages sont acceptables pour les utilisateurs disposant d'une connexion Internet plus lente.

    Nous nous efforçons d'informer les propriétaires de sites à l'avance des modifications importantes apportées à nos algorithmes de recherche lorsque ces modifications peuvent leur donner l'occasion d'améliorer la facilité d'utilisation de leur site. Par exemple, en janvier 2018, nous avons annoncé que nos algorithmes commenceraient à prendre en compte la vitesse de chargement des pages six mois avant l'application de ces changements. Nous avons également mis à la disposition des propriétaires de sites Web des conseils détaillés et des outils tels que PageSpeed Insights et Webpagetest.org afin qu'ils puissent s'informer sur les éventuels changements à mettre en œuvre pour rendre leurs sites plus adaptés aux mobiles.

    Vous trouverez plus d'informations sur les outils et conseils fournis aux propriétaires de sites par Google sur cette page.

  • Prise en compte du contexte

    Prise en compte du contexte

    De vos paramètres de recherche à votre situation géographique, en passant par l'historique de vos recherches, toutes ces informations nous permettent de vous proposer les résultats les plus pertinents et les plus utiles à l'instant T.

    Nous renvoyons des contenus adaptés à votre zone géographique, en fonction de votre position et de votre pays. Si vous recherchez le terme "football" à Chicago, les résultats Google concerneront sans doute le football américain avec, en tête de liste, des pages sur les Chicago Bears. Par contre, pour la même recherche lancée depuis Paris, les pages sur le football et sur la Ligue 1 seront mieux classées. Les paramètres de recherche peuvent également nous renseigner sur les résultats qui vous conviennent. Par exemple, vous pouvez avoir défini une langue de prédilection ou avoir activé SafeSearch (pour bloquer les résultats explicites).

    Il nous arrive également de personnaliser vos résultats sur la base d'informations liées à votre activité de recherche récente. Supposons que vous lanciez une recherche sur "Barcelone". Le fait que vous ayez récemment saisi la requête "Barcelone contre Arsenal" fournit une indication importante : vous recherchez sans doute des informations concernant le club de football, pas la ville. Vous avez la possibilité de contrôler l'activité de recherche servant à améliorer votre expérience de la recherche Google, y compris en paramétrant les données qui sont enregistrées dans votre compte Google, depuis la page myaccount.google.com.

    La recherche comprend également des fonctionnalités qui personnalisent les résultats en fonction de l'activité de votre compte Google. Par exemple, si vous recherchez des "événements à proximité", Google peut adapter certaines recommandations aux catégories d'événements susceptibles de vous intéresser. Ces systèmes sont conçus pour refléter vos centres d'intérêt et non pour tenter de déduire des caractéristiques sensibles, telles que votre origine ethnique, votre religion ou vos convictions politiques.

    Vous avez la possibilité de contrôler l'activité de recherche servant à améliorer votre expérience de la recherche Google, y compris en paramétrant les données qui sont enregistrées dans votre compte Google, depuis la page myaccount.google.com. Si vous ne souhaitez pas bénéficier de la personnalisation de la recherche basée sur l'activité de votre compte, désactivez l'option "Activité sur le Web et les applications".