Înainte ca dvs. să căutați, crawlerele web culeg informații de pe sute de miliarde de pagini web și le organizează în indexul Căutării Google.

Bazele Căutării Google

Procesul de accesare cu crawlere începe cu o listă de adrese web rezultată din accesările anterioare cu crawlere și cu sitemap-uri trimise de proprietarii site-urilor. Când crawlerele accesează aceste site-uri, folosesc linkurile din acele pagini pentru a descoperi alte pagini. Software-ul acordă o atenție specială site-urilor noi, modificărilor aduse site-urilor existente și linkurilor inactive. Programe software speciale stabilesc ce site-uri să acceseze, cu ce frecvență și câte pagini să preia de pe fiecare site.

Oferim Search Console pentru ca proprietarii de site-uri să beneficieze de opțiuni detaliate privind modul în care Google le accesează site-ul cu crawlere: acestea pot să afișeze instrucțiuni detaliate despre prelucrarea paginilor de pe site, să solicite o reaccesare cu crawlere sau să renunțe complet la accesarea cu crawlere, folosind un fișier denumit „robots.txt”. Google nu acceptă niciodată plăți ca să acceseze mai frecvent cu crawlere un site. Le oferă aceleași instrumente tuturor site-urilor, din dorința de a le asigura utilizatorilor săi cele mai bune rezultate.

Găsirea informațiilor prin accesarea cu crawlere

Internetul este ca o bibliotecă a cărei colecție crește mereu, are miliarde de cărți, dar îi lipsește un sistem de centralizare. Pentru a descoperi pagini web disponibile public folosim software-uri numite crawlere web. Crawlerele analizează pagini web și urmează linkuri către paginile respective, așa cum ați face și dvs. când căutați conținut pe web. Acestea trec de la un link la altul și trimit date despre paginile web respective la serverele Google.

Organizarea informațiilor prin indexare

Când crawlerele găsesc o pagină web, sistemele noastre redau conținutul paginii, exact așa cum face un browser. Ținem cont de principalele semnale, de la cuvintele cheie până la actualitatea site-ului, și ținem evidența acestor aspecte în indexul Căutării Google.

Indexul Căutării Google conține sute de miliarde de pagini web și are o dimensiune de peste 100.000.000 de gigabyți. Este ca indexul de la finalul unei cărți, cu o intrare pentru fiecare cuvânt găsit în fiecare pagină web pe care o indexăm. Când indexăm o pagină web, o adăugăm intrărilor corespunzătoare tuturor cuvintelor pe care le conține.

 

 

Prin Knowledge Graph, nu ne limităm la potrivirea de cuvinte cheie, ci încercăm să înțelegem oamenii, locurile și lucrurile care vă interesează. În acest scop, nu organizăm numai informații despre pagini web, ci și alte tipuri de informații. Acum, Căutarea Google vă poate ajuta să căutați text din milioane de cărți din biblioteci importante, să găsiți programul mijloacelor de transport de la agenția de transport public local sau vă poate ajuta să căutați date din surse publice cum ar fi Banca Mondială.