Bloccare l'indicizzazione della Ricerca con noindex

noindex è una serie di regole con un <meta> tag o un'intestazione della risposta HTTP, utilizzata per impedire l'indicizzazione dei contenuti da parte dei motori di ricerca che supportano la regola noindex, come Google. Quando durante la scansione estrarrà il tag o l'intestazione, Googlebot eliminerà completamente la pagina dai risultati della Ricerca Google, a prescindere dalla presenza o meno di altri siti contenenti link che rimandano alla pagina.

L'utilizzo di noindex è utile se non hai accesso root al tuo server, perché ti consente di controllare l'accesso al tuo sito pagina per pagina.

Implementare noindex

Esistono due modi per implementare noindex: sotto forma di tag <meta> e sotto forma di intestazione della risposta HTTP. L'effetto ottenuto sarà identico, quindi scegli il metodo più pratico per il tuo sito e più appropriato al tipo di contenuti. Specificare la regola noindex nel file robots.txt non è un'operazione supportata da Google.

Puoi anche combinare la regola noindex con altre regole che controllano l'indicizzazione. Ad esempio, puoi unire un suggerimento nofollow con una regola noindex: <meta name="robots" content="noindex, nofollow" />.

Tag <meta>

Per impedire a tutti i motori di ricerca che supportano la regola noindex di indicizzare una pagina del tuo sito, inserisci il seguente tag <meta> nella sezione <head> della pagina:

<meta name="robots" content="noindex">

Per impedire solo ai web crawler di Google di indicizzare una pagina:

<meta name="googlebot" content="noindex">

Tieni presente che alcuni motori di ricerca potrebbero interpretare la regola noindex in modo diverso. Di conseguenza, è possibile che la tua pagina continui ad apparire nei risultati di altri motori di ricerca.

Scopri di più sul <meta> tag noindex.

Intestazione della risposta HTTP

Anziché un tag <meta>, nella risposta puoi restituire un'intestazione HTTP X-Robots-Tag con un valore noindex o none. Puoi anche utilizzare un'intestazione della risposta per risorse non HTML, come PDF, file video e file immagine. Di seguito è riportato un esempio di risposta HTTP con un'intestazione X-Robots-Tag che indica ai motori di ricerca di non indicizzare una pagina:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Scopri di più sull'intestazione della risposta noindex.

Eseguire il debug dei problemi relativi a noindex

Dobbiamo eseguire la scansione della tua pagina per poter rilevare tag <meta> e intestazioni HTTP. Se una pagina è ancora presente nei risultati, è probabile che non abbiamo eseguito la scansione della pagina da quando hai aggiunto il tag noindex. A seconda dell'importanza della pagina su internet, Googlebot potrebbe impiegare mesi per visitarla di nuovo. Puoi chiedere a Google di ripetere la scansione di una pagina usando lo strumento Controllo URL.

Se devi rimuovere rapidamente una pagina del tuo sito dai risultati di ricerca di Google, consulta la nostra documentazione sulle rimozioni.

Un altro motivo per cui non siamo in grado di vedere il tag potrebbe essere che il file robots.txt sta bloccando questo URL dai web crawler di Google. Per sbloccare la tua pagina da Google, è necessario modificare il file robots.txt.

Infine, assicurati che la regola noindex sia visibile a Googlebot. Per verificare se l'implementazione di noindex è corretta, utilizza lo strumento Controllo URL per verificare il codice HTML ricevuto da Googlebot durante la scansione della pagina. Puoi anche usare il report Indicizzazione delle pagine in Search Console per monitorare le pagine del sito da cui Googlebot ha estratto una regola noindex.