Come funzionano gli algoritmi della Ricerca

Con la quantità di informazioni disponibili sul Web trovare quello che cerchi sarebbe praticamente impossibile senza uno strumento che ti aiuti a selezionarle. I sistemi di ranking di Google sono progettati proprio a questo scopo: ordinano centinaia di miliardi di pagine web nell'indice di Ricerca per fornire i risultati più utili e pertinenti in una frazione di secondo e li presentano in modo da aiutarti a trovare quello che stavi cercando.

Questi sistemi di ranking sono costituiti non da uno, ma da una serie di algoritmi. Per fornirti le informazioni più utili, gli algoritmi della Ricerca prendono in esame diversi fattori, tra cui le parole che hai usato nella query, la pertinenza e l'usabilità delle pagine, l'affidabilità delle fonti, la tua posizione e le tue impostazioni. L'importanza attribuita a ogni fattore cambia in base al tipo di query; ad esempio, la data di pubblicazione dei contenuti ha un ruolo più incisivo nel rispondere a query relative ad argomenti di attualità che a query riguardo a definizioni del dizionario.

Per assicurarci che gli algoritmi della Ricerca soddisfino standard di pertinenza e qualità elevati, disponiamo di una procedura rigorosa che include test in tempo reale e coinvolge migliaia di valutatori esterni della qualità della Ricerca provenienti da ogni parte del mondo. Tali valutatori della qualità seguono delle precise linee guida che definiscono i nostri obiettivi per gli algoritmi della Ricerca e sono disponibili al pubblico affinché tutti possano consultarle.

Di seguito trovi ulteriori informazioni sui fattori principali che determinano quali risultati vengono restituiti per la tua query.

  • Analisi delle parole

    Analisi delle parole

    La comprensione del significato della tua ricerca è di cruciale importanza per fornirti risposte buone. Per trovare pagine con informazioni pertinenti, dunque, il primo passaggio prevede l'analisi del significato delle parole usate nella tua query di ricerca. Costruiamo modelli linguistici per cercare di decifrare le stringhe di parole da cercare nell'indice.

    Ciò implica dei passaggi apparentemente semplici, dall'interpretazione di errori di ortografia al tentativo di comprensione del tipo di query che hai inserito, applicando alcune delle ultime ricerche nell'ambito della comprensione del linguaggio naturale. Ad esempio, il nostro sistema di sinonimi aiuta Ricerca a capire cosa intendi dire, anche se una parola ha più definizioni. Per sviluppare tale sistema ci sono voluti più di cinque anni e ci è servito a migliorare in modo significativo i risultati in oltre il 30% delle ricerche in tutte le lingue.

    Cerchiamo inoltre di capire quale tipo di informazioni stai cercando. Si tratta di una ricerca specifica o di una query più ampia? Ci sono parole come "recensione" o "immagini" o "orari di apertura" che indicano l'esigenza di un'informazione specifica oltre la ricerca? Stai cercando le parole chiave di tendenza e, di conseguenza, sei interessato ai contenuti pubblicati in quella giornata? O stai cercando un'attività nelle vicinanze e vorresti delle informazioni sulla zona?

    Ai fini della classificazione delle query è particolarmente importante stabilire se tramite la tua query stai cercando contenuti aggiornati. Se cerchi parole chiave di tendenza, i nostri algoritmi di aggiornamento lo interpreteranno come un indicatore del fatto che informazioni aggiornate potrebbero essere più utili di pagine meno recenti. Questo significa che se cerchi i risultati più recenti per "punteggi serie A", "ballando con le stelle" o "ricavi exxon", vedrai le informazioni più aggiornate.

  • Corrispondenza con la ricerca

    Corrispondenza con la ricerca

    In seguito cerchiamo pagine web contenenti informazioni che corrispondono alla tua query. Quando effettui una ricerca a livello base, i nostri algoritmi cercano i tuoi termini di ricerca nell'indice per trovare le pagine appropriate. Poi analizzano la frequenza e la posizione di tali parole chiave nei titoli, nelle intestazioni o nel corpo di una pagina.

    Quando una pagina web contiene le stesse parole chiave della tua query di ricerca, significa che quelle informazioni sono pertinenti. Se le parole chiave sono presenti nella pagina, nelle intestazioni o nel corpo del testo, è più probabile che le informazioni siano pertinenti. Oltre alla corrispondenza delle parole chiave utilizziamo dati aggregati e anonimi sulle interazioni per valutare quali risultati di ricerca sono pertinenti rispetto alle query. Trasformiamo tali dati in indicatori che aiutano i nostri sistemi di machine learning a valutare meglio la pertinenza.

    Oltre a trovare le parole chiave corrispondenti, gli algoritmi cercano indizi per misurare in che percentuale i risultati di ricerca forniscono i risultati che gli utenti stanno cercando. Quando cerchi la parola "cani" non significa che tu voglia trovare una pagina in cui la parola "cani" è ripetuta centinaia di volte. Cerchiamo di capire se la pagina contiene una risposta alla tua query e non una ripetizione della stessa. Pertanto gli algoritmi di Ricerca analizzano le pagine per stabilire se queste includano contenuti pertinenti (ad esempio foto di cani, video o persino un elenco delle razze). Infine, controlliamo che la pagina sia scritta nella stessa lingua in cui hai posto la domanda, al fine di dare priorità alle pagine nella tua lingua preferita.

    È importante tenere presente che i nostri sistemi cercano questo tipo di indicatori quantificabili per valutare la pertinenza, ma non sono progettati per analizzare concetti soggettivi come opinioni o l'orientamento politico dei contenuti di una pagina.

  • Ranking di pagine utili

    Ranking di pagine utili

    Per una tipica query ci sono migliaia se non milioni di pagine web con informazioni potenzialmente pertinenti. Pertanto, per far sì che le pagine migliori appaiano nelle prime posizioni, scriviamo degli algoritmi appositi per valutare l'utilità di queste pagine web.

    Questi algoritmi analizzano centinaia di fattori diversi per cercare di esaminare le informazioni migliori offerte dal Web, dalla freschezza dei contenuti al numero di volte in cui i tuoi termini di ricerca appaiono o, ancora, se la pagina offre una buona esperienza utente o meno. Al fine di valutare l'affidabilità e l'autorità in relazione all'oggetto della ricerca, cerchiamo i siti che molti utenti hanno preferito per delle query simili. Se altri siti di rilievo in quell'ambito collegano alla pagina, è un buon segno e sta a indicare l'alta qualità della pagina.

    Esistono numerosi siti contenenti spam sul Web che cercano di manipolare i risultati di ricerca per avanzare di posizioni attraverso tecniche come la molteplice ripetizione di parole chiave o l'acquisto di link che aumentano il PageRank. Tali siti offrono un'esperienza utente molto scarsa e possono anche danneggiare o confondere gli utenti Google. Per questo motivo scriviamo algoritmi in grado di identificare lo spam e rimuovere i siti che violano le istruzioni per i webmaster Google dai nostri risultati.

    I contenuti sul Web e, più in generale, l'ecosistema delle informazioni sono in continuo cambiamento e per questo misuriamo e valutiamo costantemente la qualità dei nostri sistemi per garantire il giusto equilibrio tra pertinenza e autorevolezza delle informazioni e assicurarci che la tua fiducia nei risultati visualizzati resti invariata.

  • Restituzione dei migliori risultati

    Restituzione dei migliori risultati

    Prima di pubblicare i tuoi risultati, valutiamo in che modo tutte le informazioni pertinenti si combinano tra di loro: c'è un solo argomento nei risultati di ricerca o più di uno? Ci sono troppe pagine che si concentrano su una sola interpretazione restrittiva? Ci impegniamo per fornire un insieme diversificato di informazioni nei formati più utili per il tuo tipo di ricerca. Con l'evoluzione del Web, anche noi evolviamo i nostri sistemi di ranking per fornire risultati migliori a un numero sempre maggiore di query.

    Questi algoritmi analizzano indicatori che segnalano se tutti gli utenti sono in grado di visualizzare il risultato, ad esempio se il sito viene visualizzato correttamente in browser diversi; se è progettato per tutte le tipologie e dimensioni di dispositivo, inclusi computer desktop, tablet e smartphone; e se i tempi di caricamento della pagina sono adatti anche a utenti con connessioni lente.

    Dato che i proprietari dei siti web possono migliorare l'usabilità del proprio sito, cerchiamo di informarli in anticipo di eventuali modifiche ai nostri algoritmi della Ricerca. Ad esempio, a gennaio 2018 abbiamo annunciato (con ben sei mesi di anticipo rispetto al lancio) che i nostri algoritmi avrebbero iniziato a tenere in considerazione la "velocità delle pagine" dei siti. Per aiutare i proprietari di siti web, abbiamo fornito guide dettagliate e strumenti come PageSpeed Insights e Webpagetest.org, in modo che potessero comprendere le eventuali modifiche da apportare per rendere il loro sito ottimizzato per dispositivi mobili.

    Puoi trovare ulteriori informazioni sugli strumenti e suggerimenti che Google fornisce ai proprietari di siti qui.

  • Considerazione del contesto

    Considerazione del contesto

    Informazioni quali la tua posizione, la cronologia delle ricerche precedenti e le impostazioni di Ricerca ci consentono di personalizzare i risultati secondo ciò che è più utile e pertinente per te in quel momento.

    Per fornirti contenuti pertinenti per la tua zona, utilizziamo le informazioni relative al tuo paese e alla tua posizione. Ad esempio, se sei a Chicago e cerchi "football", con molta probabilità Google ti mostrerà per primi i risultati del football americano e dei Chicago Bears. Mentre se cerchi "football" a Londra, Google mostrerà tra i primi risultati le notizie del calcio e della Premier League. Le impostazioni di ricerca sono un indicatore molto importante anche in relazione ai risultati che tu ritieni più utili, ad esempio se imposti una lingua preferita o hai attivato SafeSearch (uno strumento che ti consente di filtrare i risultati espliciti).

    In alcuni casi potremmo anche personalizzare i risultati utilizzando le informazioni della tua recente attività su Ricerca. Ad esempio, se fai una ricerca su "Barcellona" e di recente hai cercato "Barcellona contro Arsenal", quest'ultima ricerca ci dà un indizio importante: le informazioni che stai cercando potrebbero riguardare la squadra di calcio e non la città. Puoi controllare l'attività di ricerca utilizzata per migliorare la tua esperienza su Ricerca e determinare quali dati vengono salvati nel tuo account Google alla pagina myaccount.google.com.

    La Ricerca presenta anche alcune funzioni che personalizzano i risultati in base all'attività del tuo Account Google. Ad esempio, se cerchi "eventi vicino a me", Google può fornirti dei suggerimenti personalizzati per categorie di eventi che pensiamo ti potrebbero interessare. Questi sistemi sono progettati per fornirti risultati relativi ai tuoi interessi, ma non sono in grado di dedurre informazioni personali come la tua etnia, religione o il tuo partito politico.

    Puoi controllare l'attività di ricerca utilizzata per migliorare la tua esperienza sulla Ricerca e determinare quali dati vengono salvati nel tuo Account Google nella pagina myaccount.google.com. Per disattivare la personalizzazione della ricerca a partire dall'attività sul tuo account, disattiva l'Attività web e app.