Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Empêcher l'affichage des informations masquées dans la recherche Google
Lorsque vous publiez des documents et des images sur le Web, il peut arriver que des informations que les internautes ne devraient pas voir apparaissent par erreur. Par exemple, certaines données que vous ne voyez peut-être pas, ou que vous aviez l'intention de masquer, peuvent être ajoutées dans certains formats de documents et être détectées par les moteurs de recherche.
Comme les moteurs de recherche indexent les contenus publics sur le Web, y compris les images, il est possible qu'ils affichent les éléments qui ne sont pas masqués en bonne et due forme. Les technologies d'assistance telles que les lecteurs d'écran peuvent faciliter l'accès à ce contenu soi-disant "masqué", tandis que les techniques courantes d'interprétation d'images telles que la reconnaissance optique des caractères (ROC) permettent la recherche de ce contenu.
Même si vous optez pour une police de caractère de très petite taille ou dont la couleur se fond dans celle de l'arrière-plan, ou que vous couvrez le texte avec une image afin de rendre un certain type de contenu invisible à l'œil nu, ces méthodes ne le masquent pas réellement et n'empêchent donc pas les moteurs de recherche de l'indexer ni de l'afficher.
Par ailleurs, certains types de documents comprennent d'autres types d'informations qui ne sont pas immédiatement visibles. Ils peuvent, par exemple, inclure l'historique des modifications du document, qui permet aux utilisateurs de voir le texte qui a été masqué ou modifié. Ils peuvent également conserver des versions complètes d'images recadrées ou masquées. Il peut aussi s'agir de métadonnées incluses dans un fichier (et qui ne sont pas immédiatement visibles) afin de lister les noms des personnes ayant accédé à ce fichier ou l'ayant modifié.
Toutes ces informations peuvent persister même si un document est exporté ou converti d'un format à un autre. Si vous devez supprimer des informations d'un fichier, il est essentiel de vous assurer que celles-ci ont bel et bien été éliminées du fichier avant de le publier.
Voici quelques bonnes pratiques à suivre pour masquer correctement les informations que vous ne souhaitez pas indexer ni rendre visibles dans la recherche Google.
Modifier et exporter les images avant de les intégrer
La recherche Google répertorie les images identifiées sur le Web, qu'elles se trouvent sur des pages Web ou qu'elles soient intégrées dans différents formats de documents. Les images intégrées ne sont parfois modifiées qu'à l'aide des outils d'édition du document qui les contient. Cette approche peut entraver l'action de suppression lorsqu'une image est indexée en dehors du document. C'est pourquoi il est préférable de modifier les images avant de les intégrer dans un document, et non après. Tenez particulièrement compte des points suivants :
Supprimez les informations indésirables des images avant de les intégrer dans des documents. Certains outils d'édition de documents (tels que les outils de traitement de texte ou les outils de création de diapositives) conservent les images non recadrées que vous utilisez dans la version publique du document. Veillez donc à lire attentivement la documentation concernant l'outil en question.
Supprimez complètement ou dissimulez tout texte ou toute autre portion non publique de l'image, car les systèmes de reconnaissance optique des caractères peuvent convertir le texte des images en texte inclus dans l'index de recherche.
Supprimez toutes les métadonnées qui ne vous intéressent pas.
Après avoir suivi les suggestions de ce document, exportez ou enregistrez les images mises à jour dans des formats de fichiers image non vectoriels ou plats, tels que PNG ou WebP. Cela évite que ces portions d'images soient incluses par inadvertance dans un document public.
Modifier ou supprimer le texte indésirable avant de passer à un format de fichier public
Avant de générer le document public, supprimez le texte que vous ne souhaitez pas afficher dans la version finale du fichier. Optez pour un format public qui ne conserve pas l'historique de vos modifications précédentes. Voici quelques conseils plus spécifiques :
Si un fichier doit contenir des informations masquées, utilisez des outils appropriés de masquage de document. Évitez par exemple de disposer des rectangles noirs au-dessus du texte pour le masquer, car ce texte risquerait quand même d'être inclus dans le document public.
Vérifiez minutieusement les métadonnées du document dans le fichier public.
Tenez compte des informations contenues dans l'URL ou dans le nom de fichier lui-même. Même si l'exploration d'une partie d'un site Web est bloquée par le fichier robots.txt, les URL peuvent être indexées dans la recherche (sans son contenu). Utilisez des hachages dans les paramètres d'URL au lieu d'adresses e-mail ou de noms.
Envisagez de recourir à l'authentification pour limiter l'accès au contenu masqué. Diffusez la page de connexion obtenue avec une balise metanoindexrobots afin de bloquer l'indexation.
Lors de la publication, assurez-vous que le site Web est validé dans la Google Search Console.
Cela permet de procéder à une suppression rapide, si nécessaire.
Que faire si des documents non masqués ou masqués de manière inappropriée sont indexés dans la recherche ?
Supprimez le document en ligne du site Web ou de l'emplacement où vous l'avez publié.
Utilisez l'outil de suppression pour le site validé afin de supprimer les documents en question de la recherche. Utilisez un préfixe d'URL pour supprimer un grand nombre de documents. Pour les sites validés, la suppression d'URL prend généralement moins d'une journée. Cette action empêche l'affichage du document en question pour toute recherche ciblant le contenu masqué.
Hébergez le document masqué en bonne et due forme sous une autre URL. Cela garantit que toutes les nouvelles versions indexées correspondent au nouveau document, et non à une ancienne version (la réexploration des URL et leur mise à jour dans un index de recherche peuvent prendre un certain temps). Mettez à jour les liens vers ces documents.
Contactez le webmaster des autres sites susceptibles d'héberger également les documents masqués et demandez-lui de les supprimer. Invitez-le à utiliser l'outil de suppression dans son compte Search Console ou l'outil de suppression de contenu obsolète pour que les systèmes Google mettent à jour les résultats de recherche en conséquence.
Autorisez l'expiration des demandes de suppression d'URL (cela se produit après la mise à jour des URL dans l'index de recherche Google ou au bout de six mois environ).
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/08/04 (UTC)."],[[["\u003cp\u003eAvoid unintentionally publishing sensitive information hidden within documents or images, as search engines can index this data.\u003c/p\u003e\n"],["\u003cp\u003eEmploy proper redaction techniques like cropping, obscuring, or removing sensitive content before publishing files, rather than relying on visual concealment methods.\u003c/p\u003e\n"],["\u003cp\u003eEdit images and remove unwanted text before embedding them into documents to prevent unintended exposure of redacted content.\u003c/p\u003e\n"],["\u003cp\u003eUse the Google Search Console's removal tools if improperly redacted documents are indexed to quickly remove them from search results.\u003c/p\u003e\n"]]],["To keep information out of Google Search, properly redact documents before publishing. Edit images before embedding them, cropping unwanted parts, removing text, and deleting metadata. Remove unwanted text from documents, using redaction tools instead of merely covering text. Export images in non-vector formats. For indexed, improperly redacted content, remove the live document, use Google Search Console's Removals tool, host a properly redacted version under a new URL, and contact other hosts to remove the documents.\n"],null,["# Keep Redacted Information out of Google | Google Search Central\n\nKeep redacted information out of Google Search\n==============================================\n\n\nWhen publishing documents and images on the web, you may unintentionally publish information\nbeyond what is immediately visible to the human eye. In particular, information that you might\nnot see, or that was intended to be redacted, might be included in some document formats and\nvisible to search engines.\n\nBecause search engines index public material on the web, including images, content that is\nnot completely redacted can potentially be findable in search engines. Assistive technologies\nlike screen readers can make this seemingly \"hidden\" content more easily accessible, and\ncommon image understanding techniques like optical character recognition (OCR) similarly make\nit possible to search for this content.\n\nEven though putting text in a tiny font, using a font color that's the same as the background\nthe text is on, or covering text with an image may make something invisible to the human eye,\nthese methods don't actually redact material in a way that prevents search engines from\nindexing it and making it findable.\n\n\nSimilarly, some document types include information in various ways that aren't immediately\nvisible. They might include the document's change history, allowing users to see text that has\nbeen redacted or altered. They might retain the full versions of images that contain cropped\nor redacted information. There might also be metadata that's included in a file, which is not\nimmediately visible, that may list the names of people who accessed or edited the file.\n\n\nAll of this information can remain even when a document is exported or converted from one\nformat to another. If you need to remove information from a file, it's critical that the\ninformation is removed completely from the file before that file is made public.\n\n\nHere are some best practices for how to appropriately redact information from documents that\nyou don't want to be indexed and made discoverable via Google Search.\n\nEdit and export images before embedding them\n--------------------------------------------\n\n\nGoogle Search lists images that it finds across the web, both those that are on web pages or\nthose that are embedded into various document formats. Embedded images are sometimes edited\nusing only the containing document's editing tools. This can cause this redaction to fail when\nan image is indexed apart from the document. That is why it's best to edit images before\nembedding them into a document, not after. In particular:\n\n- Crop out unwanted information from images before embedding them into documents. Some document editing tools (such as word processors or slide creation tools) will maintain any uncropped images that you use in the public version of the document, so be sure to review the tool's documentation thoroughly.\n- Completely remove or obscure any text or other non-public parts of the image, as OCR systems may turn any image text seen into searchable text.\n- Remove any undesired metadata.\n\n\nAfter following the suggestions in this document, export or save the updated images as non-vector or\nflattened image file formats such as PNG or WEBP. This prevents those parts of the images from\nbeing inadvertently included in a public document.\n\nEdit or remove unwanted text before moving to a public file format\n------------------------------------------------------------------\n\n\nBefore you generate the public document, remove any text that you don't want displayed in the\nfinal version of the file. Move to a public format that does not keep your previous change\nhistory. Here are more specific tips:\n\n- Use proper document redacting tools if a file needs to have information redacted. For example, avoid placing black rectangles over text as a redaction method, as this can result in the text still being included in the public document.\n- Double-check the document metadata in the public file.\n- Follow the [document redaction best practices](https://www.google.com/search?q=document+redaction+best+practices) for the format that you are using (PDF, image, etc).\n- Consider information in the URL or file name itself. Even if a part of a website is [blocked by robots.txt](/search/docs/crawling-indexing/robots/intro), the URLs may be indexed in search (without their content). Use hashes in URL parameters instead of email addresses or names.\n- Consider using authentication to limit access to the redacted content. Serve the resulting login page with a [`noindex` robots `meta` tag](/search/docs/crawling-indexing/block-indexing) to block indexing.\n- When publishing, make sure that the website is [verified in Google Search Console](https://support.google.com/webmasters/answer/9008080). This allows quick removal action, if needed.\n\nWhat to do if unredacted or improperly redacted documents are indexed in Search\n-------------------------------------------------------------------------------\n\n1. Remove the live document from the website or location where you published it.\n2. Use the [Removals tool](https://support.google.com/webmasters/answer/9689846) for the verified site to remove the documents in question from Search. Use a URL prefix if you need to remove many documents. For verified sites, a URL removal generally takes less than a day. This prevents the document in question from appearing for any searches for redacted content.\n3. Host the properly redacted document under a different URL. This makes sure that any newly indexed version is of the new document, and not an older version of the document (since recrawling of URLs and updating them in a search index can take a bit of time). Update any links to those documents.\n4. Contact any other site that may also be hosting the improperly redacted documents and ask them to take them down as well. Ask them to use the Removals tool in their Search Console account, or you can use the [Outdated Content tool](https://support.google.com/webmasters/answer/7041154) to ask Google's systems to update the search results.\n5. Allow the URL removal requests to expire (this happens after the URLs were either updated in the Google Search index, or after about 6 months)."]]