Lista de rastreadores de casos especiais do Google

Os rastreadores de casos especiais são usados por produtos específicos do Google quando há um acordo entre o site rastreado e o produto sobre o processo de rastreamento. Por exemplo, AdsBot ignora o user agent global (*) do robots.txt com a permissão do publisher de anúncios. As propriedades técnicas gerais dos rastreadores do Google também se aplicam aos rastreadores de casos especiais.

Os rastreadores de casos especiais podem ignorar as regras do robots.txt. Por isso, eles operam em um intervalo de IP diferente dos rastreadores comuns. Os intervalos de IP são publicados no objeto special-crawlers.json. A máscara de DNS reversa dos rastreadores de casos especiais corresponde a rate-limited-proxy-***-***-***-***.google.com.

A lista a seguir mostra os rastreadores de casos especiais, as strings de user agent conforme aparecem nas solicitações HTTP, os tokens do user agent para a linha User-agent: no robots.txt e os produtos que são afetados pelas preferências de rastreamento. A lista não é completa, abrange apenas os solicitantes com maior probabilidade de aparecer nos arquivos de registro e que sobre quais recebemos perguntas.

User agent em solicitações HTTP
APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)
robots.txt
Token do user agent no robots.txt

APIs-Google


O user agent global (*) é ignorado.

Exemplo de grupo do robots.txt
user-agent: APIs-Google
allow: /archive/1Q84
disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent APIs-Google afetam o envio de mensagens de notificação push pelas APIs do Google.
User agent em solicitações HTTP
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt
Token do user agent no robots.txt

AdsBot-Google-Mobile


O user agent global (*) é ignorado.

Exemplo de grupo do robots.txt
user-agent: AdsBot-Google-Mobile
allow: /archive/1Q84
disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google-Mobile afetam a capacidade do Google Ads de verificar a qualidade dos anúncios de uma página da Web.
User agent em solicitações HTTP
AdsBot-Google (+http://www.google.com/adsbot.html)
robots.txt
Token do user agent no robots.txt

AdsBot-Google


O user agent global (*) é ignorado.

Exemplo de grupo do robots.txt
user-agent: AdsBot-Google
allow: /archive/1Q84
disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google afetam a capacidade do Google Ads de verificar a qualidade dos anúncios de uma página da Web.
User agent em solicitações HTTP
Agente de computador
Mediapartners-Google
Agente de dispositivo móvel
(Various mobile device types) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)
robots.txt
Token do user agent no robots.txt Mediapartners-Google

O user agent global (*) é ignorado.

Exemplo de grupo do robots.txt
user-agent: Mediapartners-Google
allow: /archive/1Q84
disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent Mediapartners-Google afetam o Google AdSense. O Rastreador do AdSense visita os sites participantes para mostrar anúncios relevantes.
User agent em solicitações HTTP
Google-Safety
robots.txt O user agent Google-Safety ignora as regras do robots.txt.
Produtos afetados O user agent do Google-Safety processa o rastreamento específico de abuso, como a descoberta de malware em links postados publicamente nos Serviços do Google. Por isso, ele não é afetado pelas preferências de rastreamento.

Rastreadores de casos especiais desativados

Os rastreadores de casos especiais a seguir não estão mais em uso e são mencionados apenas para referência histórica.

User agent em solicitações HTTP
Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Mobile/15E148 Safari/604.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt
Token do user agent no robots.txt AdsBot-Google-Mobile

O user agent global (*) é ignorado.

Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google-Mobile afetaram a capacidade do Google Ads de verificar a qualidade dos anúncios de páginas da Web em iPhones.
User agent em solicitações HTTP
Mozilla/5.0 (Linux; Android 11; Pixel 2; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Mobile Safari/537.36
robots.txt
Token do user agent no robots.txt DuplexWeb-Google

É possível que o Duplex na Web ignore o caractere curinga *.

Produtos afetados Compatível com o serviço Duplex na Web.
User agent em solicitações HTTP
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon
robots.txt
Token do user agent no robots.txt Googlebot-Image
Googlebot
User agent em solicitações HTTP
AdsBot-Google-Mobile-Apps
robots.txt
Token do user agent no robots.txt AdsBot-Google-Mobile-Apps

O user agent AdsBot-Google-Mobile-Apps obedeceu às regras de robôs AdsBot-Google, mas ignorou o user agent global (*).

Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google-Mobile-Apps afetam a capacidade do Google Ads de verificar a qualidade dos anúncios na página do app Android.
User agent em solicitações HTTP
Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19
robots.txt
Token do user agent no robots.txt googleweblight

O user agent googleweblight era usado somente para solicitações explícitas de navegação de visitantes humanos. Portanto, ele ignorava as regras do robots.txt, que são usadas para bloquear solicitações de rastreamento automatizadas.

Produtos afetados O user agent do Web Light verificava a presença do cabeçalho no-transform sempre que um usuário clicava na página na Pesquisa sob as condições apropriadas.