Com funcionen els algoritmes de la Cerca

Amb la quantitat d'informació disponible al web, trobar allò que necessites seria gairebé impossible sense una mica d'ajuda en la cerca. Els sistemes de classificació de Google estan dissenyats per fer precisament això: cercar entre centenars de milers de milions de pàgines web incloses a l'índex de la Cerca per trobar els resultats més rellevants i útils en una fracció de segon, i mostrar-te'ls de manera que t'ajudin a trobar el que busques.

Aquests sistemes de classificació es basen no només en un, sinó en tota una sèrie d'algoritmes. Per donar-te la informació més útil, els algoritmes de la Cerca tenen en compte molts factors, com ara les paraules de la consulta, la rellevància i usabilitat de les pàgines, el nivell de coneixements de les fonts, i la teva ubicació i configuració. La importància de cada factor varia en funció de les característiques de la consulta: per exemple, la publicació recent del contingut juga un paper més important a l'hora de respondre consultes sobre notícies d'actualitat que no pas quan es tracta de mostrar definicions de diccionari.

Per assegurar-nos que els algoritmes de la Cerca assoleixin uns estàndards elevats de rellevància i qualitat, apliquem un procés rigorós que consisteix en proves en temps real amb l'ajuda de milers d'avaluadors de qualitat de la Cerca d'arreu del món. Aquests avaluadors de qualitat segueixen unes directrius que defineixen els nostres objectius per als algoritmes de la Cerca i que estan disponibles públicament per a tothom.

A continuació pots obtenir més informació sobre els factors clau que ajuden a determinar quins resultats torna la teva consulta:

  • Analitzar les teves paraules

    Analitzar les teves paraules

    Comprendre el significat de la cerca és crucial per oferir respostes satisfactòries. Per tant, per trobar pàgines amb informació rellevant, el primer que fem és analitzar què volen dir les paraules de la teva consulta de cerca. Creem models de llenguatge per intentar desxifrar quines cadenes de paraules hem de buscar a l'índex.

    Aquest procés inclou passos aparentment senzills, com ara interpretar errades ortogràfiques, i també passos més complexos, com ara comprendre el tipus de consulta que has introduït aplicant els últims avenços en el camp de la comprensió del llenguatge natural. Per exemple, el nostre sistema de sinònims ajuda la Cerca a interpretar què vols dir encara que una paraula tingui diverses definicions. Aquest sistema, que s'ha tardat més de cinc anys a desenvolupar, millora significativament els resultats en més del 30% de les cerques en tots els idiomes.

    També intentem comprendre quin tipus d'informació busques. És una cerca molt específica o més aviat general? Inclou paraules com "opinions", "imatges" o "horari" que indiquen que s'està cercant una cosa concreta? Cerques paraules clau populars que suggereixen que vols contingut que s'ha publicat aquell dia? O cerques una empresa a prop i vols informació local?

    Un aspecte especialment important d'aquesta categorització de les consultes és la nostra anàlisi per determinar si la consulta cerca contingut publicat recentment. Si cerques paraules clau considerades tendència, els nostres algoritmes d'actualitat ho interpretaran com un senyal que la informació recent pot ser més útil que les pàgines més antigues. Això significa que, quan cerquis els darrers "resultats de la Lliga de Campions", "finalistes d'Eurovisió" o "beneficis de CaixaBank", veuràs la informació més recent.

  • Cercar coincidències de la cerca

    Cercar coincidències de la cerca

    Després, cerquem pàgines web amb informació que coincideixi amb la consulta. Quan fas una cerca, al nivell més bàsic, els nostres algoritmes cerquen els teus termes de cerca a l'índex per trobar les pàgines adequades. Analitzen la freqüència i el lloc on es mostren les paraules clau en una pàgina, ja sigui en títols, encapçalaments o el cos del text.

    El senyal més bàsic que indica que la informació és rellevant és la presència en una pàgina web de les mateixes paraules clau que has introduït a la consulta de cerca. Si aquestes paraules clau són a la pàgina o bé a les capçaleres o al cos del text, és més probable que la informació sigui rellevant. A més d'aquest mètode senzill de concordança de paraules clau, fem servir dades d'interacció agregades i anonimitzades per determinar si els resultats de cerca són rellevants per a les consultes. Transformem aquestes dades en senyals que ajuden els nostres sistemes d'aprenentatge automàtic a estimar-ne millor la rellevància.

    A més de cercar coincidències amb les paraules clau, els algoritmes també cerquen pistes que indiquin si els resultats potencials de la cerca tenen la informació que cerca l'usuari. Quan cerques "gossos", probablement no vols veure una pàgina on aparegui centenars de vegades la paraula "gossos". Intentem esbrinar si la pàgina conté una resposta a la teva consulta i no només la repeteix. Per tant, els algoritmes analitzen si les pàgines inclouen contingut rellevant, com ara, en aquest cas, imatges o vídeos de gossos, o fins i tot una llista de races. Finalment, comprovem que la pàgina estigui escrita en el mateix idioma que la teva pregunta, per prioritzar les pàgines que estan escrites en l'idioma que prefereixes.

    És important destacar que, tot i que els nostres sistemes cerquen aquests senyals quantificables per avaluar la rellevància, no estan dissenyats per analitzar conceptes subjectius com ara el punt de vista o la tendència política del contingut d'una pàgina.

  • Millorar el posicionament de les pàgines útils

    Millorar el posicionament de les pàgines útils

    Per a una consulta normal, hi ha milers, fins i tot milions, de pàgines web amb informació potencialment rellevant. Per això, per ajudar-nos a classificar les millors pàgines en les primeres posicions, també escrivim algoritmes que avaluen la utilitat d'aquestes pàgines web.

    Per mostrar la millor informació que pot oferir el web, aquests algoritmes analitzen centenars de factors diferents, des de la data de publicació del contingut fins al nombre de vegades que apareixen els teus termes de cerca i la qualitat de l'experiència d'usuari a la pàgina. A més, cerquem llocs web que hagin estat útils en consultes similars per avaluar-ne la fiabilitat i la credibilitat. Si altres llocs web destacats sobre el tema contenen enllaços a aquesta pàgina, és un bon senyal que la informació és d'alta qualitat.

    Al web hi ha molts llocs web amb contingut fraudulent que tracten de situar-se entre els primers llocs dels resultats de la cerca mitjançant tècniques, com ara repetir paraules clau constantment o comprar enllaços que millorin la classificació de PageRank. Aquests llocs web ofereixen una experiència d'usuari molt dolenta i poden fins i tot ser perjudicials o enganyosos per als usuaris de Google. Per això, escrivim algoritmes per identificar i suprimir dels resultats que oferim els llocs web que infringeixen les directrius per a administradors web de Google.

    Com que el contingut del web i el conjunt de l'ecosistema d'informació canvien constantment, mesurem i avaluem de manera contínua la qualitat dels nostres sistemes. Així ens volem assegurar que aconseguim l'equilibri adequat entre la rellevància i l'autoritat de la informació perquè continuïs confiant en els resultats que et mostrem.

  • Tornar els millors resultats

    Tornar els millors resultats

    Abans de mostrar-te els resultats de la cerca, analitzem tota la informació en conjunt, és a dir, si hi ha només un tema en els resultats de la cerca, o si hi ha massa pàgines que se centrin en una única interpretació. Procurem proporcionar informació diversa en els formats més útils per al tipus de cerca que has fet. I a mesura que evoluciona el web anem desenvolupant els nostres sistemes de classificació per proporcionar millors resultats per a un major nombre de consultes.

    Aquests algoritmes analitzen senyals que indiquen si tots els usuaris poden veure el resultat, cosa que depèn, per exemple, de si el lloc web es mostra correctament en diversos navegadors, si està dissenyat per a dispositius de qualsevol tipus i mida (com ara ordinadors, tauletes i telèfons intel·ligents), i si els temps de càrrega de la pàgina són correctes per a usuaris amb connexions a Internet lentes.

    Com que els propietaris de llocs web poden millorar la usabilitat dels seus llocs, ens esforcem de valent per informar-los anticipadament de canvis significatius als algoritmes de la Cerca. Per exemple, el gener de 2018, sis mesos abans d'aplicar el canvi, vam anunciar que els nostres algoritmes començarien a tenir en compte la "velocitat de pàgina" dels llocs web. Per tal d'ajudar els propietaris de llocs web, vam proporcionar ajuda detallada i eines com ara PageSpeed Insights i Webpagetest.org. Així podrien saber què havien de modificar per fer que els seus llocs web estiguessin millor adaptats per a mòbils.

    Pots obtenir més informació sobre les eines i els consells que Google proporciona als propietaris de llocs web aquí.

  • Tenir en compte el context

    Tenir en compte el context

    Informació com ara la teva ubicació, l'historial de cerques anteriors i la configuració de la Cerca ens ajuda a adaptar els resultats i oferir-te allò que et serà més útil i rellevant en aquell moment.

    Fem servir el teu país i la teva ubicació per oferir-te contingut rellevant per a la regió on et trobis. Per exemple, si vius a Barcelona i cerques "futbol", Google probablement et mostrarà resultats sobre la Lliga espanyola i el F. C. Barcelona en primer lloc. En canvi, si cerques "futbol" a Chicago, Google classificarà en posicions més elevades els resultats sobre futbol americà i els Chicago Bears. La configuració de la Cerca és també un indicador important dels resultats que probablement et semblin més útils, per exemple si has establert un idioma preferit o has activat SafeSearch (una eina que ajuda a filtrar els resultats amb contingut explícit).

    En alguns casos també podem personalitzar els resultats fent servir informació sobre l'activitat recent de l'usuari a la Cerca. Per exemple, si cerques "Barcelona" i fa poc has cercat "Barcelona - Arsenal", aquesta podria ser una pista important de la informació que t'interessa, en aquest cas sobre el club de futbol i no pas la ciutat. Pots controlar quina activitat de cerca es fa servir per millorar l'experiència amb la Cerca, com ara ajustar quines dades es desen al teu compte de Google, a myaccount.google.com.

    La Cerca també inclou algunes funcions que personalitzen els resultats segons l'activitat del teu Compte de Google. Per exemple, si cerques "esdeveniments a prop", Google pot adaptar algunes de les recomanacions a categories d'esdeveniments que pensem que et poden interessar. Aquests sistemes estan dissenyats perquè els resultats coincideixin amb els teus interessos, però no dedueixen característiques sensibles com la teva raça, religió o partit polític.

    Pots controlar quina activitat de cerca es fa servir per millorar l'experiència amb la Cerca, per exemple ajustant quines dades es desen al teu Compte de Google, a myaccount.google.com. Si no vols que es personalitzi la Cerca en funció de l'activitat al teu compte, desactiva l'opció de configuració Activitat al web i en aplicacions.