Guida ai sistemi di ranking della Ricerca Google
Google utilizza sistemi di ranking automatici che esaminano molti fattori e indicatori relativi a centinaia di miliardi di pagine web e altri contenuti nel nostro indice della Ricerca al fine di presentare i risultati più utili e pertinenti, il tutto in una frazione di secondo.
Miglioriamo regolarmente questi sistemi tramite valutazioni e test rigorosi e forniamo comunicazioni nel caso di aggiornamenti quando potrebbero essere utili per gli autori di contenuti e altri utenti.
Questa pagina è una guida per comprendere alcuni dei nostri sistemi di ranking più importanti. Tratta di alcuni sistemi che fanno parte di quelli principali, ovvero le tecnologie sottostanti che producono risultati di ricerca in risposta alle query; inoltre, prende in esame alcuni sistemi coinvolti nel caso di specifiche esigenze di ranking.
Puoi anche visitare il sito Come funziona la Ricerca per capire in che modo i nostri sistemi di ranking vengono combinati con altri processi e come collaborano per consentire alla Ricerca Google di portare avanti la nostra missione: organizzare le informazioni a livello mondiale e renderle universalmente accessibili e utili.
BERT
Bidirectional Encoder Representations from Transformers (BERT) è un sistema di IA che Google utilizza per comprendere in che modo le combinazioni di parole esprimono significati e intenti diversi.
Sistemi informativi per le emergenze
Google ha sviluppato dei sistemi per fornire informazioni utili e tempestive durante le situazioni di emergenza, indipendentemente dal fatto che siano crisi personali, calamità naturali o altre situazioni di emergenza su larga scala:
- Crisi personale: i nostri sistemi funzionano in modo da comprendere quando le persone stanno cercando informazioni su situazioni di crisi personali al fine di mostrare numeri di emergenza e contenuti di organizzazioni attendibili in corrispondenza di determinate query correlate a suicidio, violenza sessuale, ingerimento di veleni, violenza di genere o dipendenza da droghe. Scopri di più su come le informazioni relative a crisi personali vengono visualizzate nella Ricerca Google.
- Allerte SOS: in caso di calamità naturali o situazioni di emergenza su larga scala, il nostro sistema Allerte SOS mostra gli aggiornamenti di autorità locali, nazionali o internazionali. Questi aggiornamenti potrebbero includere numeri di telefono e siti web di emergenza, mappe, traduzioni di frasi utili, opportunità per donazioni e altro ancora. Scopri di più sul funzionamento di Allerte SOS e su come fanno parte delle allerte crisi di Google che aiutano nei casi di inondazioni, incendi e terremoti, uragani e altri disastri.
Sistemi di deduplicazione
Tramite una ricerca su Google si possono trovare migliaia o addirittura milioni di pagine web corrispondenti, e alcune potrebbero essere molto simili tra loro. In questi casi, i nostri sistemi mostrano solo i risultati più pertinenti per evitare duplicati inutili. Scopri di più su come funziona la deduplicazione e come visualizzare i risultati omessi (se vuoi) quando avviene la deduplicazione.
La deduplicazione si verifica anche con gli snippet in primo piano: se una scheda di una pagina web viene promossa per diventare uno snippet in primo piano, non viene ripetuta più avanti nella prima pagina dei risultati. Ciò favorisce una visualizzazione più ordinata e aiuta le persone a trovare più facilmente informazioni pertinenti.
Sistema di domini con corrispondenza esatta
I nostri sistemi di classificazione considerano le parole nei nomi di dominio come uno dei tanti fattori per determinare se i contenuti sono pertinenti per una ricerca. Tuttavia, il nostro sistema di domini con corrispondenza esatta garantisce che non venga assegnato troppo credito ai contenuti ospitati su domini progettati per corrispondere esattamente a query specifiche. Ad esempio, qualcuno potrebbe creare un nome di dominio contenente le parole "posti migliori dove pranzare" nella speranza che tutte quelle parole nel nome di dominio favoriscano il ranking. Il nostro sistema interviene in caso di queste situazioni.
Sistemi di contenuti aggiornati
Disponiamo di vari sistemi progettati per mostrare i contenuti più aggiornati possibili in corrispondenze di determinate query, quando sono previsti questi risultati aggiornati. Ad esempio, se una persona cerca un film appena uscito, probabilmente vuole leggere recensioni recenti invece che articoli che risalgono a quando è iniziata la produzione. Per fare un altro esempio, di solito la ricerca "terremoto" restituisce informazioni per prepararsi a un simile evento e risorse correlate; tuttavia, se di recente si è verificato un terremoto, potrebbero essere mostrate notizie e articoli più aggiornati.
Sistemi di analisi dei link e PageRank
Disponiamo di diversi sistemi che comprendono il modo in cui le pagine rimandano l'una all'altra come metodo per determinare l'argomento delle pagine e quali potrebbero essere più utili in risposta a una query. Tra questi c'è PageRank, uno dei nostri principali sistemi di ranking, utilizzato sin dal lancio di Google. I curiosi possono scoprire di più consultando la ricerca originale su PageRank e il relativo brevetto. Il funzionamento di PageRank si è evoluto molto da allora, ma continua ancora a far parte dei nostri sistemi di ranking principali.
Sistemi di notizie locali
Disponiamo di sistemi che si occupano di identificare e visualizzare le fonti di notizie locali, se pertinenti, ad esempio tramite le nostre funzionalità "Notizie principali" e "Notizie locali".
MUM
MUM (Multitask Unified Model) è un sistema di IA in grado di comprendere e generare un linguaggio. Al momento non viene utilizzato per il ranking generale nella Ricerca ma per alcune applicazioni specifiche, ad esempio migliorare le ricerche di informazioni sui vaccini contro il COVID-19 e migliorare i callout degli snippet in primo piano che mostriamo.
Corrispondenza neurale
La corrispondenza neurale è un sistema di IA che Google utilizza per comprendere le rappresentazioni di concetti nelle query e nelle pagine e associarle l'una all'altra.
Sistemi di contenuti originali
Disponiamo di sistemi che ci aiutano a mostrare i contenuti originali in una posizione ben visibile nei risultati di ricerca, tra cui le notizie originali, prima di altri contenuti che si limitano a citare queste notizie. Ciò include il supporto di uno speciale markup canonical che gli autori di contenuti possono utilizzare per aiutarci a comprendere meglio qual è la pagina principale se una pagina è stata duplicata in più punti.
Sistemi di retrocessione basati sulla rimozione
Google ha implementato delle norme che consentono la rimozione di determinati tipi di contenuti. Se elaboriamo un volume elevato di queste rimozioni che riguardano un determinato sito, lo utilizziamo come un indicatore per migliorare i nostri risultati. In particolare:
- Rimozione per motivi legali: Quando riceviamo un numero elevato di richieste di rimozione valide per violazione del copyright relative a un determinato sito, siamo in grado di utilizzarle per far retrocedere altri contenuti dal sito nei nostri risultati. In questo modo, se sono presenti altri contenuti in violazione, è meno probabile che le persone li trovino rispetto ai contenuti originali. Applichiamo indicatori di retrocessione simili a reclami che riguardano diffamazione, articoli contraffatti e rimozioni per ingiunzione di un tribunale. Nel caso di materiale pedopornografico, rimuoviamo sempre questi contenuti quando vengono identificati e retrocediamo tutti i contenuti dai siti con un'alta percentuale di contenuti pedopornografici.
- Rimozione di informazioni personali: Se elaboriamo un volume elevato di rimozioni di informazioni personali che riguardano un sito con pratiche abusive per la rimozione dei contenuti, retrocediamo altri contenuti dal sito nei nostri risultati. Verifichiamo inoltre se lo stesso modello di comportamento è presente su altri siti e, in questo caso, applichiamo le retrocessioni ai contenuti di questi siti. Potremmo applicare pratiche di retrocessione simili per i siti che ricevono un volume elevato di rimozioni di contenuti che includono contenuti di doxxing, immagini personali esplicite create o condivise senza consenso o contenuti falsi espliciti non consensuali.
Sistema di ranking dei passaggi
Il ranking dei passaggi è un sistema di IA che utilizziamo per identificare singole sezioni o "passaggi" di una pagina web e comprendere meglio la pertinenza di una pagina a una ricerca.
RankBrain
RankBrain è un sistema di IA che ci aiuta a comprendere la correlazione tra le parole e i concetti. Ciò significa che possiamo restituire contenuti più pertinenti anche se non sono presenti tutte le parole esatte utilizzate in una ricerca, semplicemente comprendendo che i contenuti sono correlati ad altre parole e concetti.
Sistemi informativi affidabili
Sistemi diversi funzionano in vari modi per mostrare le informazioni più affidabili possibili, ad esempio per mettere in evidenza le pagine più autorevoli e far retrocedere i contenuti scadenti, nonché promuovere il giornalismo di qualità. Nei casi in cui manchino informazioni affidabili, i nostri sistemi mostrano automaticamente avvertenze sui contenuti per argomenti in rapida evoluzione o quando i nostri sistemi non hanno un grado di certezza elevato della qualità complessiva dei risultati disponibili per la ricerca; vengono offerti suggerimenti su come eseguire ricerche che potrebbero portare a risultati più utili. Scopri di più sul nostro approccio per offrire informazioni di alta qualità nella Ricerca.
Sistema delle recensioni
Il sistema delle recensioni ha lo scopo di riconoscere meglio il valore delle recensioni di alta qualità, ovvero contenuti che forniscono un'analisi approfondita e ricerche originali e che siano stati scritti da persone esperte o appassionate che conoscono bene l'argomento.
Sistema di diversità dei siti
Il nostro sistema di diversità dei siti funziona in modo da impedire generalmente la visualizzazione nei risultati principali di più di due schede di pagine web dello stesso sito, in modo che nessun sito tenda ad avere una presenza dominante nei primi risultati. Tuttavia, potremmo comunque mostrare più di due schede nei casi in cui i nostri sistemi determinano che sono particolarmente pertinenti per una determinata ricerca. In genere, il sistema di diversità dei siti considera i sottodomini come parte di un dominio principale; ovvero, le schede di un sottodominio (subdomain.example.com) e del dominio principale (example.com) saranno considerate tutte dallo stesso sito. Tuttavia, a volte i sottodomini vengono trattati come siti separati ai fini della diversità, se ciò è pertinente.
Sistemi di rilevamento dello spam
Nessuno vuole che la propria casella di posta in arrivo sia piena di spam, ed è per questo che i filtri antispam sono così utili. La Ricerca affronta una sfida simile, perché internet include enormi quantità di spam che, se non gestite, ci impedirebbero di mostrare i risultati più utili e pertinenti. Adottiamo un'ampia gamma di sistemi di rilevamento dello spam, inclusi SpamBrain, per gestire i contenuti e i comportamenti che violano le nostre norme relative allo spam. Questi sistemi vengono costantemente aggiornati per stare al passo con le più recenti evoluzioni delle minacce spam.
Sistemi ritirati
I seguenti sistemi sono indicati a fini storici; sono stati incorporati nei sistemi successivi o resi parte dei nostri sistemi di ranking principali.
Sistema di contenuti utili
Annunciato nel 2022 come "Aggiornamento dei contenuti utili", si è trattato di un sistema progettato per garantire che le persone vedano nei risultati di ricerca contenuti originali e utili scritti da persone per altre persone, anziché contenuti realizzati principalmente per generare traffico dai motori di ricerca. A marzo 2024, si è evoluto ed è diventato parte dei nostri sistemi di ranking principali, dato che utilizzano una varietà di indicatori e sistemi per presentare risultati utili agli utenti.
Hummingbird
Si tratta di un importante miglioramento ai nostri sistemi di ranking complessivi, effettuato nell'agosto 2013. Da allora, i sistemi hanno continuato a evolversi, esattamente come prima.
Sistema Panda
Si tratta di un sistema progettato per garantire una migliore visualizzazione di contenuti originali e di alta qualità nei nostri risultati di ricerca. Annunciato nel 2011 e soprannominato "Panda", si è evoluto ed è diventato parte dei nostri sistemi di ranking principali nel 2015.
Sistema Penguin
Si trattava di un sistema progettato per contrastare i link di spam. Annunciato nel 2012 con il nickname "Aggiornamento Penguin", nel 2016 è stato integrato nei nostri sistemi di ranking principali.