Escludere le informazioni oscurate dalla Ricerca Google

Quando pubblichi documenti e immagini sul Web, potresti pubblicare involontariamente altre informazioni oltre a quelle immediatamente visibili. In particolare, le informazioni che potresti non vedere, o che avrebbero dovuto essere oscurate, potrebbero essere incluse in alcuni formati di documenti ed essere visibili ai motori di ricerca.

Poiché i motori di ricerca indicizzano il materiale pubblico presente sul Web, incluse le immagini, i contenuti non completamente oscurati potrebbero essere rilevabili nei motori di ricerca. Le tecnologie per la disabilità, come gli screen reader, possono rendere più facilmente accessibili questi contenuti apparentemente "nascosti" e le tecniche comuni di interpretazione delle immagini, come il riconoscimento ottico dei caratteri (OCR), consentono di cercare questi contenuti.

Anche se l'uso di un carattere molto piccolo, la copertura con un'immagine o l'utilizzo di un colore di carattere uguale a quello dello sfondo su cui si trova il testo potrebbero renderlo invisibile all'occhio umano, questi metodi non oscurano effettivamente il materiale in modo tale da impedire ai motori di ricerca di indicizzarlo e renderlo rilevabile.

Analogamente, alcuni tipi di documenti includono in vari modi informazioni che non sono immediatamente visibili. Potrebbero includere la cronologia delle modifiche del documento, che consente agli utenti di vedere il testo oscurato o alterato. Potrebbero conservare le versioni complete delle immagini che contengono informazioni ritagliate oppure oscurate. Potrebbero esserci anche metadati inclusi in un file, non immediatamente visibile, che potrebbero elencare i nomi delle persone che hanno visualizzato o modificato il file.

Tutte queste informazioni possono rimanere anche quando un documento viene esportato o convertito da un formato a un altro. Se devi rimuovere informazioni da un file, è fondamentale rimuoverle completamente dal file prima che quest'ultimo venga reso pubblico.

Di seguito sono riportate alcune best practice su come oscurare correttamente nei documenti le informazioni che non vuoi che vengano indicizzate e rese rilevabili tramite la Ricerca Google.

Modificare ed esportare le immagini prima di incorporarle

Nella Ricerca Google sono incluse le immagini trovate sul Web, sia quelle presenti nelle pagine web sia quelle incorporate in documenti di vari formati. Talvolta le immagini incorporate vengono modificate utilizzando soltanto gli strumenti di modifica del documento che le contiene. In questo caso l'oscuramento potrebbe non andare a buon fine se un'immagine viene indicizzata separatamente dal documento. Ecco perché è meglio modificare le immagini prima di incorporarle in un documento e non dopo. In particolare:

  • Ritaglia le informazioni indesiderate dalle immagini prima di incorporarle nei documenti. Alcuni strumenti di modifica dei documenti (come gli elaboratori di testo o gli strumenti di creazione di diapositive) mantengono le immagini non ritagliate utilizzate nella versione pubblica del documento, quindi assicurati di leggere con attenzione la documentazione dello strumento usato.
  • Oscura o rimuovi completamente il testo o altre parti non pubbliche dell'immagine, perché i sistemi OCR potrebbero trasformare il testo dell'immagine rilevato in testo disponibile per la ricerca.
  • Rimuovi eventuali metadati indesiderati.

Dopo aver seguito i suggerimenti in questo documento, esporta o salva le immagini aggiornate come formati di file immagine non vettoriali o semplificati, ad esempio PNG o WebP. In questo modo, le parti dell'immagine in questione non verranno incluse involontariamente in un documento pubblico.

Modificare o rimuovere il testo indesiderato prima di passare a un formato file pubblico

Prima di generare il documento pubblico, rimuovi l'eventuale testo che non vuoi mostrare nella versione finale del file. Passa a un formato pubblico che non conserva la cronologia delle modifiche precedenti. Ecco alcuni suggerimenti più specifici:

  • Utilizza strumenti dedicati e appropriati se devi oscurare informazioni in un file. Ad esempio, evita di oscurare il testo coprendolo con rettangoli neri perché il testo potrebbe comunque essere incluso nel documento pubblico.
  • Controlla bene i metadati del documento nel file pubblico.
  • Segui le best practice per l'oscuramento dei documenti relative al formato che stai utilizzando (PDF, immagine e così via).
  • Considera le informazioni presenti nell'URL o nel nome del file stesso. Anche se una parte di un sito web è bloccata dal file robots.txt, gli URL potrebbero essere indicizzati nella ricerca (senza i relativi contenuti). Utilizza gli hash nei parametri URL anziché indirizzi email o nomi.
  • Valuta la possibilità di utilizzare l'autenticazione per limitare l'accesso ai contenuti oscurati. Pubblica la pagina di accesso risultante con un meta tag robots noindex per bloccare l'indicizzazione.
  • Quando pubblichi la pagina, assicurati che il sito web sia verificato in Google Search Console. In questo modo sarà possibile rimuoverla rapidamente, se necessario.
  1. Rimuovi il documento pubblicato dal sito web o dalla posizione in cui l'hai pubblicato.
  2. Utilizza lo strumento per le rimozioni per il sito verificato al fine di rimuovere i documenti in questione dalla Ricerca. Se devi rimuovere molti documenti, utilizza un prefisso URL. Generalmente la rimozione di URL di siti verificati richiede meno di un giorno. In questo modo il documento in questione non viene visualizzato per alcuna ricerca relativa ai contenuti oscurati.
  3. Ospita il documento correttamente oscurato in corrispondenza di un URL diverso. In questo modo puoi assicurarti che l'eventuale versione appena indicizzata sia relativa al nuovo documento e non sia precedente (perché la nuova scansione degli URL e il relativo aggiornamento in un indice di ricerca potrebbero richiedere del tempo). Aggiorna eventuali link che rimandano a tali documenti.
  4. Contatta eventuali altri siti che potrebbero ospitare i documenti oscurati scorrettamente e chiedi di rimuoverli. Chiedi di utilizzare lo strumento per le rimozioni nel relativo account Search Console; oppure, puoi utilizzare lo strumento Rimuovi contenuti obsoleti per richiedere l'aggiornamento dei risultati di ricerca da parte dei sistemi di Google.
  5. Consenti la scadenza delle richieste di rimozione degli URL (in genere scadono dopo che gli URL sono stati aggiornati nell'indice della Ricerca Google o dopo circa 6 mesi).