Liste des robots d'exploration communs de Google
Les robots d'exploration communs de Google permettent de trouver des informations pour créer les index de recherche de Google, d'effectuer d'autres explorations spécifiques à un produit et de procéder à des analyses. Ils respectent toujours les règles du fichier robots.txt lors de l'exploration automatique. Les propriétés techniques générales des robots d'exploration de Google s'appliquent également aux robots d'exploration communs.
Les robots d'exploration communs explorent généralement les plages d'adresses IP publiées dans l'objet googlebot.json. De plus, le masque DNS inversé de leur nom d'hôte correspond à crawl-***-***-***-***.googlebot.com
ou geo-crawl-***-***-***-***.geo.googlebot.com
.
La liste suivante présente les robots d'exploration communs, leurs chaînes d'user-agent telles qu'elles apparaissent dans les requêtes HTTP, leurs jetons user-agent pour la ligne User-agent:
dans le fichier robots.txt, ainsi que les produits concernés par les préférences d'exploration du robot d'exploration. Certains robots utilisent plusieurs jetons user-agent. Un seul jeton de robot doit correspondre pour qu'une règle s'applique. La liste n'est pas exhaustive. Elle ne couvre que les demandeurs qui sont plus susceptibles d'apparaître dans les fichiers journaux et pour lesquels nous avons reçu des questions.
-
Googlebot
-
User-Agent
dans les requêtes HTTPGooglebot pour smartphone Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Robot Googlebot pour ordinateur Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36
Rarement :
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot/2.1 (+http://www.google.com/bot.html)
robots.txt Jeton user-agent dans le fichier robots.txt Googlebot
Exemple de groupe robots.txt user-agent: Googlebot allow: /archive/1Q84 disallow: /archive
Produits concernés Les préférences d'exploration adressées au user-agent Googlebot
affectent la recherche Google (y compris Discover et toutes les options d'affichage dans les résultats de recherche Google), ainsi que d'autres produits tels que Google Images, Google Vidéo, Google Actualités et Discover. Googlebot Image
-
User-agent dans les requêtes HTTP Googlebot-Image/1.0
robots.txt Jeton user-agent dans le fichier robots.txt Googlebot-Image
Googlebot
Exemple de groupe robots.txt user-agent: Googlebot-Image allow: /archive/1Q84 disallow: /archive/moons.jpg
Produits concernés Les préférences d'exploration adressées au user-agent Googlebot-Image
affectent Google Images, Discover, Google Vidéo et toutes les fonctionnalités de la recherche Google où des images, des logos et des favicons sont présentés. Googlebot Video
-
User-agent dans les requêtes HTTP Googlebot-Video/1.0
robots.txt Jeton user-agent dans le fichier robots.txt Googlebot-Video
Googlebot
Exemple de groupe robots.txt user-agent: Googlebot-Video allow: /archive/1Q84 disallow: /archive/
Produits concernés Les préférences d'exploration adressées au user-agent Googlebot-Video
affectent les options d'affichage dans les résultats de recherche Google liées aux vidéos et d'autres produits qui en dépendent. Googlebot Google Actualités
-
User-agent dans les requêtes HTTP Googlebot-news ne dispose pas d'une chaîne user-agent de requête HTTP distincte. L'exploration est effectuée à l'aide de différentes chaînes user-agent Googlebot. robots.txt Jeton user-agent dans le fichier robots.txt Googlebot-News
Googlebot
Exemple de groupe robots.txt user-agent: Googlebot-News allow: /archive/1Q84 disallow: /archive/
Produits concernés Les préférences d'exploration adressées au user-agent Googlebot-News
affectent toutes les surfaces de Google Actualités (par exemple, l'onglet "Actualités" dans la recherche Google et l'application Google Actualités). Google StoreBot
-
User-agent dans les requêtes HTTP Agent pour ordinateur Mozilla/5.0 (X11; Linux x86_64; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Safari/537.36
Agent mobile Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36
robots.txt Jeton user-agent dans le fichier robots.txt Storebot-Google
Exemple de groupe robots.txt user-agent: Storebot-Google allow: /archive/1Q84 disallow: /archive/konbini
Produits concernés Les préférences d'exploration adressées au user-agent Storebot-Google
affectent toutes les surfaces de Google Shopping (par exemple, l'onglet "Shopping" dans la recherche Google et Google Shopping). Google-InspectionTool
-
User-agent dans les requêtes HTTP Agent pour ordinateur Mozilla/5.0 (compatible; Google-InspectionTool/1.0;)
Agent mobile Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Google-InspectionTool/1.0;)
robots.txt Jeton user-agent dans le fichier robots.txt Google-InspectionTool
Googlebot
Exemple de groupe robots.txt user-agent: Google-InspectionTool allow: /archive/1Q84 disallow: /archive/
Produits concernés Les préférences d'exploration adressées au user-agent Google-InspectionTool
affectent les outils de test de la recherche, tels que le test des résultats enrichis et l'inspection des URL dans la Search Console. Cela n'a aucune incidence sur la recherche Google ni sur d'autres produits. GoogleOther
-
User-agent dans les requêtes HTTP Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; GoogleOther)
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GoogleOther) Chrome/W.X.Y.Z Safari/537.36
robots.txt Jeton user-agent dans le fichier robots.txt GoogleOther
Exemple de groupe robots.txt user-agent: GoogleOther allow: /archive/1Q84 disallow: /archive/
Produits concernés Les préférences d'exploration adressées au user-agent GoogleOther
n'affectent aucun produit spécifique. GoogleOther est le robot d'exploration générique dont différentes équipes produit peuvent se servir pour extraire du contenu accessible au public sur les sites. Par exemple, il peut être utilisé pour des explorations ponctuelles à des fins de recherche et de développement internes. Cela n'a aucune incidence sur la recherche Google ni sur d'autres produits. GoogleOther-Image
-
User-agent dans les requêtes HTTP GoogleOther-Image/1.0
robots.txt Jeton user-agent dans le fichier robots.txt GoogleOther-Image
GoogleOther
Exemple de groupe robots.txt user-agent: GoogleOther-Image allow: /archive/1Q84 disallow: /archive/moon.jpg
Produits concernés Les préférences d'exploration adressées au user-agent GoogleOther-Image
n'affectent aucun produit spécifique, comme GoogleOther. GoogleOther-Image est la version de GoogleOther optimisée pour extraire les URL d'images accessibles au public. GoogleOther-Video
-
User-agent dans les requêtes HTTP GoogleOther-Video/1.0
robots.txt Jeton user-agent dans le fichier robots.txt GoogleOther-Video
GoogleOther
Exemple de groupe robots.txt user-agent: GoogleOther-Video allow: /archive/1Q84 disallow: /archive
Produits concernés Les préférences d'exploration adressées au user-agent GoogleOther-Video
n'affectent aucun produit spécifique, comme GoogleOther. GoogleOther-Video est la version de GoogleOther optimisée pour extraire des URL de vidéos accessibles au public. Google-CloudVertexBot
-
Sous-chaîne user-agent dans les requêtes HTTP Google-CloudVertexBot
robots.txt Jeton user-agent dans le fichier robots.txt Google-CloudVertexBot
Googlebot
Exemple de groupe robots.txt user-agent: Google-CloudVertexBot allow: /archive/1Q84 disallow: /archive/
Produits concernés Les préférences d'exploration adressées au user-agent Google-CloudVertexBot
affectent les explorations demandées par les propriétaires de sites pour créer des agents Vertex AI. Cela n'a aucune incidence sur la recherche Google ni sur d'autres produits. Google-Extended
-
User-agent dans les requêtes HTTP Google-Extended ne dispose pas d'une chaîne user-agent de requête HTTP distincte. L'exploration s'effectue à l'aide des chaînes user-agent Google existantes. Le jeton user-agent du fichier robots.txt est utilisé pour le contrôle. robots.txt Jeton user-agent dans le fichier robots.txt Google-Extended
Exemple de groupe robots.txt user-agent: Google-Extended allow: /archive/1Q84 disallow: /archive/
Produits concernés Google-Extended
est un jeton de produit autonome que les éditeurs Web peuvent utiliser pour choisir si leurs sites contribuent à améliorer les API génératives des applications Gemini et Vertex AI, y compris les futures générations de modèles qui alimentent ces produits. L'ancrage avec la recherche Google sur Vertex AI n'utilise pas les pages Web pour l'ancrage qui ont interdit Google-Extended. Google-Extended n'a aucune incidence sur l'inclusion ou le classement d'un site dans la recherche Google.
Remarque concernant Chrome/W.X.Y.Z dans les user-agents
La chaîne Chrome/W.X.Y.Z dans les chaînes user-agent de la liste est un espace réservé qui représente la version du navigateur Chrome utilisée par ce user-agent (par exemple, 41.0.2272.96
). Ce numéro de version augmente au fil du temps afin de représenter la dernière version de Chromium utilisée par Googlebot.
Si vous effectuez une recherche dans vos journaux ou si vous filtrez votre serveur afin d'identifier un user-agent avec ce format, utilisez des caractères génériques pour le numéro de version au lieu de spécifier un numéro de version précis.