Validation de Googlebot et des autres robots d'exploration Google

Vous pouvez vérifier que le robot d'exploration qui accède à votre serveur est réellement un robot Google, comme Googlebot. C'est utile si vous suspectez que des spammeurs ou d'autres personnes mal intentionnées accèdent à votre site en se faisant passer pour Googlebot.

Deux méthodes permettent de valider les robots d'exploration Google :

  • Méthode manuelle : pour les recherches ponctuelles, utilisez les outils de ligne de commande. Cette méthode est suffisante dans la plupart des cas.
  • Méthode automatique : pour les recherches plus générales, utilisez une solution automatique permettant d'établir une correspondance entre l'adresse IP d'un robot d'exploration et la liste des adresses IP Googlebot publiées.

Utiliser les outils de ligne de commande

  1. À l'aide de la commande host, exécutez une résolution DNS inverse sur l'adresse IP utilisée dans vos journaux.
  2. Vérifiez que le nom de domaine est googlebot.com ou google.com.
  3. Effectuez une résolution DNS directe sur le nom de domaine récupéré à l'étape 1 à l'aide de la commande host.
  4. Vérifiez qu'il s'agit de la même adresse IP que celle utilisée dans vos journaux.

Exemple 1 :

host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

host crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com has address 66.249.66.1

Exemple 2 :

host 66.249.90.77
77.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.

host rate-limited-proxy-66-249-90-77.google.com
rate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77

Utiliser des solutions automatiques

Vous pouvez également identifier Googlebot avec l'adresse IP, en établissant une correspondance entre l'adresse IP du robot d'exploration et la liste des adresses IP Googlebot. Pour les autres adresses IP Google à partir desquelles vous pouvez accéder à votre site (par exemple, sur demande de l'utilisateur ou Apps Scripts), faites correspondre l'adresse IP à la Liste des adresses IP Google.