Como funcionam os algoritmos da Pesquisa

Com a quantidade de informações disponíveis na Web, encontrar o que você precisa seria quase impossível sem nenhuma ajuda para classificá-las. Os sistemas de classificação do Google organizam centenas de bilhões de páginas da Web no índice da Pesquisa para fornecer os resultados mais úteis e relevantes em uma fração de segundo e apresentá-los de uma maneira que ajude você a encontrar o que está procurando.

Esses sistemas de classificação são compostos não por um, mas por uma série de algoritmos. Para fornecer as informações mais úteis, os algoritmos da Pesquisa analisam vários fatores, inclusive palavras da consulta, relevância e usabilidade das páginas, conhecimento das fontes, bem como seu local e configurações. O peso aplicado a cada fator varia de acordo com a natureza da consulta. Por exemplo, a atualização do conteúdo desempenha um papel mais importante na resposta a consultas sobre tópicos de notícias atuais do que sobre definições de dicionário.

Para ajudar a garantir que os algoritmos da Pesquisa atendam a altos padrões de relevância e qualidade, temos um processo rigoroso que envolve testes em tempo real e milhares de avaliadores externos de qualidade da Pesquisa treinados no mundo todo. Esses avaliadores de qualidade seguem as rígidas diretrizes que definem nossas metas para algoritmos da Pesquisa e estão disponíveis publicamente para qualquer pessoa.

Abaixo, saiba mais sobre os principais fatores que ajudam a determinar quais resultados aparecem na sua consulta:

  • Analisar suas palavras

    Analisar suas palavras

    Compreender o significado da sua pesquisa é crucial para retornarmos boas respostas. Por isso, para encontrar páginas com informações relevantes, nosso primeiro passo é analisar o significado das palavras na consulta de pesquisa. Desenvolvemos modelos linguísticos para decifrar as sequências de palavras que precisamos procurar no índice.

    Isso envolve etapas aparentemente simples, como interpretar erros de digitação, e outras mais complexas, como tentar entender o tipo de consulta aplicando alguns dos estudos mais recentes sobre a compreensão da linguagem natural. Por exemplo, nosso sistema de sinônimos ajuda a Pesquisa a compreender o que você quer dizer, mesmo que uma palavra tenha várias definições. Esse sistema levou mais de cinco anos para ser desenvolvido e aprimora significativamente os resultados em mais de 30% das buscas em vários idiomas.

    Também tentamos entender as categorias de informações que você procura. É uma pesquisa muito específica ou uma consulta ampla? Há palavras como "resenha", "fotos" ou "horário de funcionamento" que indicam uma necessidade de informações específicas na pesquisa? Sua pesquisa tem palavras-chave em alta, indicando que você quer conteúdos publicados no mesmo dia? Ou você está em busca de uma empresa por perto e precisa de informações locais?

    Uma dimensão particularmente importante dessa categorização de consultas é nossa análise para saber se a consulta está buscando conteúdo recente. Se você pesquisar palavras-chave que são tendência, nossos algoritmos de atualização (em inglês) interpretarão isso como um sinal de que informações atualizadas são mais úteis que páginas antigas. Isso quer dizer que quando você estiver procurando pelo "resultado do Brasileirão", "dança dos famosos" ou "lucros da Petrobrás", verá as informações mais recentes.

  • Encontrar correspondências da sua pesquisa

    Encontrar correspondências da sua pesquisa

    Em seguida, procuramos páginas da Web com informações que correspondam a sua consulta. Quando você faz uma pesquisa, no nível mais básico, nossos algoritmos buscam seus termos de pesquisa no índice para encontrar as páginas apropriadas. Eles analisam com que frequência e onde essas palavras-chave aparecem na página, seja em títulos, cabeçalhos ou no corpo do texto.

    O sinal mais básico de que as informações são relevantes é quando uma página contém as mesmas palavras-chave presentes na sua consulta de pesquisa. Se essas palavras-chave aparecerem na página ou se elas aparecerem nos títulos ou no corpo do texto, é mais provável que as informações sejam relevantes. Além da correspondência simples entre palavras-chave, nós usamos dados de interação agregados e anônimos para avaliar se os resultados da pesquisa são relevantes para as consultas. Transformamos esses dados em sinais que ajudam nossos sistemas com aprendizado de máquina a estimar melhor a relevância.

    Além da correspondência de palavras-chave, os algoritmos procuram pistas para medir o quão bem os possíveis resultados de pesquisa dão aos usuários o que eles estão procurando. Quando você pesquisa "cachorros", provavelmente não está procurando uma página com a palavra "cachorros" escrita centenas de vezes. Tentamos descobrir se a página contém uma resposta à sua consulta e não apenas repete os termos pesquisados. Por esse motivo, os algoritmos da Pesquisa analisam se as páginas incluem conteúdos relevantes, como imagens ou vídeos de cachorros ou até mesmo uma lista de raças. Por último, verificamos se a página está escrita no mesmo idioma que sua pergunta, para priorizar as páginas no seu idioma preferido.

    É importante observar que, embora nossos sistemas procurem esse tipo de sinal quantificável para avaliar a relevância, eles não foram criados para analisar conceitos subjetivos, como ponto de vista ou inclinação política do conteúdo de uma página.

  • Classificar páginas úteis

    Classificar páginas úteis

    Para cada consulta comum, existem milhares (até mesmo milhões) de páginas da Web com informações que podem ser relevantes. Então, para garantir que as melhores páginas apareçam primeiro, também escrevemos algoritmos que avaliam a utilidade dessas páginas da Web.

    Para encontrar as melhores informações de toda a Web, esses algoritmos analisam centenas de fatores diferentes, como a data de criação dos conteúdos, o número de vezes que seus termos de pesquisa aparecem e a experiência do usuário nas páginas. Para avaliar se o conteúdo é confiável e informativo sobre o assunto, procuramos sites que se destacam entre os usuários com consultas semelhantes. Se outros websites importantes sobre o assunto também tiverem links para a página, veremos isso como um bom sinal de que a informação é de alta qualidade.

    Existem vários sites com spam na Web que tentam manipular os resultados da pesquisa e aumentar a própria classificação usando técnicas como a repetição de palavras-chave ou a compra de links com PageRank. Esses sites geram uma experiência muito negativa e podem até mesmo prejudicar ou enganar os usuários do Google. Por isso, escrevemos algoritmos para identificação de spam e removemos dos nossos resultados os sites que violam as diretrizes para webmasters do Google.

    O conteúdo na Web e o ecossistema mais amplo de informações estão em constante mudança, e nós avaliamos continuamente a qualidade dos nossos sistemas para garantir o equilíbrio certo entre relevância e reconhecimento, de modo a manter sua confiança nos resultados exibidos.

  • Exibir os melhores resultados

    Exibir os melhores resultados

    Antes de exibir os resultados, avaliamos como todas as informações relevantes se encaixam: os resultados da pesquisa são sobre um ou vários tópicos? Há muitas páginas que se concentram em uma interpretação restrita? Buscamos oferecer um conjunto diversificado de informações nos formatos mais úteis para seu tipo de pesquisa. Além disso, à medida que a Web evolui, atualizamos nossos sistemas de classificação para oferecer resultados melhores para cada vez mais consultas.

    Esses algoritmos analisam os sinais que indicam se todos os nossos usuários podem ver o resultado, como por exemplo, se o site aparece corretamente em diferentes navegadores, se foi projetado para todos os tipos e tamanhos de dispositivos, incluindo computadores, tablets e smartphones e se o tempo de carregamento da página funciona bem para usuários com conexões de Internet mais lentas.

    Já que os proprietários de sites podem melhorar a usabilidade do próprio site, trabalhamos arduamente para informá-los com antecedência sobre alterações significativas e acionáveis nos nossos algoritmos. Em janeiro de 2018, por exemplo, anunciamos que nossos algoritmos começariam a considerar a "velocidade da página" de sites, seis meses antes das alterações serem lançadas. Para ajudar os proprietários, fornecemos orientações e ferramentas detalhadas, como os sites: PageSpeed Insights e Webpagetest.org. Assim, proprietários de sites puderam ver o que precisavam ajustar para otimizar os sites para dispositivos móveis.

    Veja mais informações sobre as ferramentas e dicas que o Google fornece a proprietários de sites clicando aqui.

  • Interpretar o contexto

    Interpretar o contexto

    Informações como local, histórico de pesquisas anteriores e configurações da Pesquisa ajudam o Google a procurar os resultados mais úteis e relevantes para você naquele momento específico.

    Usamos seus dados de país e local para fornecer conteúdos relevantes à sua área. Por exemplo, se você estiver em Chicago, nos Estados Unidos, e pesquisar "futebol", o Google provavelmente mostrará primeiro os resultados sobre futebol americano e o Chicago Bears. No entanto, se você pesquisar "futebol" em São Paulo, o Google dará uma classificação mais alta aos resultados sobre futebol e o Campeonato Paulista. Outro indicador importante de quais resultados serão úteis para você são as configurações da Pesquisa, como sua preferência de idioma ou a ativação do SafeSearch, uma ferramenta que ajuda a filtrar os resultados com linguagem explícita.

    Em alguns casos, também podemos personalizar seus resultados usando informações sobre sua atividade de pesquisa recente. Por exemplo, se você pesquisar "Barcelona" e tiver pesquisado "Barcelona e Arsenal" recentemente, talvez isso seja uma pista importante de que você quer informações sobre o time de futebol, e não a cidade. Você pode controlar quais atividades de pesquisa serão usadas para melhorar sua experiência na Pesquisa em myaccount.google.com. Lá, você também pode escolher quais dados serão salvos na sua Conta do Google.

    A Pesquisa também inclui alguns recursos que personalizam os resultados com base na atividade da sua Conta do Google. Por exemplo, se você pesquisar por "eventos perto de mim", o Google poderá personalizar algumas recomendações para categorias de eventos que parecem interessantes para você. Esses sistemas são criados para atender aos seus interesses, mas não para inferir características sensíveis, como sua raça, sua religião ou seu partido político.

    Você pode controlar quais atividades de pesquisa serão usadas para melhorar sua experiência nesse serviço em myaccount.google.com. Lá, você também pode escolher quais dados serão salvos na sua Conta do Google. Para desativar a personalização da Pesquisa com base na atividade da sua conta, desative a "Atividade na Web e de apps".