Lista de rastreadores de casos especiais do Google
Os rastreadores de casos especiais são usados por produtos específicos do Google quando há um acordo entre
o site rastreado e o produto sobre o processo de rastreamento. Por exemplo, AdsBot
ignora
o user agent global (*
) do robots.txt com a permissão do publisher de anúncios. As
propriedades técnicas
gerais dos rastreadores do Google também se aplicam aos rastreadores de casos especiais.
Os
rastreadores de casos especiais podem ignorar as regras do robots.txt. Por isso, eles operam em um intervalo de IP
diferente dos rastreadores comuns. Os intervalos de IP são publicados no objeto
special-crawlers.json. A
máscara de DNS reversa dos rastreadores de casos especiais corresponde a
rate-limited-proxy-***-***-***-***.google.com
.
A lista a seguir mostra os rastreadores de casos especiais, as strings de user agent conforme aparecem nas
solicitações HTTP, os tokens do user agent para a linha User-agent:
no robots.txt
e os produtos que são afetados pelas preferências de rastreamento. A lista não é
completa, abrange apenas os solicitantes com maior probabilidade de aparecer nos arquivos de registro e que
sobre quais recebemos perguntas.
APIs-Google
-
User agent em solicitações HTTP APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)
robots.txt Token do user agent no robots.txt APIs-Google
O user agent global (
*
) é ignorado.Exemplo de grupo do robots.txt user-agent: APIs-Google allow: /archive/1Q84 disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent APIs-Google
afetam o envio de mensagens de notificação push pelas APIs do Google. AdsBot Mobile Web
-
User agent em solicitações HTTP Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt Token do user agent no robots.txt AdsBot-Google-Mobile
O user agent global (
*
) é ignorado.Exemplo de grupo do robots.txt user-agent: AdsBot-Google-Mobile allow: /archive/1Q84 disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google-Mobile
afetam a capacidade do Google Ads de verificar a qualidade dos anúncios de uma página da Web. AdsBot
-
User agent em solicitações HTTP AdsBot-Google (+http://www.google.com/adsbot.html)
robots.txt Token do user agent no robots.txt AdsBot-Google
O user agent global (
*
) é ignorado.Exemplo de grupo do robots.txt user-agent: AdsBot-Google allow: /archive/1Q84 disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google
afetam a capacidade do Google Ads de verificar a qualidade dos anúncios de uma página da Web. AdSense
-
User agent em solicitações HTTP Agente de computador Mediapartners-Google
Agente de dispositivo móvel (Various mobile device types) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)
robots.txt Token do user agent no robots.txt Mediapartners-Google
O user agent global (
*
) é ignorado.Exemplo de grupo do robots.txt user-agent: Mediapartners-Google allow: /archive/1Q84 disallow: /archive/
Produtos afetados As preferências de rastreamento direcionadas ao user agent Mediapartners-Google
afetam o Google AdSense. O Rastreador do AdSense visita os sites participantes para mostrar anúncios relevantes. Google-Safety
-
User agent em solicitações HTTP Google-Safety
robots.txt O user agent Google-Safety ignora as regras do robots.txt. Produtos afetados O user agent do Google-Safety processa o rastreamento específico de abuso, como a descoberta de malware em links postados publicamente nos Serviços do Google. Por isso, ele não é afetado pelas preferências de rastreamento.
Rastreadores de casos especiais desativados
Os rastreadores de casos especiais a seguir não estão mais em uso e são mencionados apenas para referência histórica.
AdsBot Mobile Web
-
User agent em solicitações HTTP Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Mobile/15E148 Safari/604.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt Token do user agent no robots.txt AdsBot-Google-Mobile
O user agent global (
*
) é ignorado.Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google-Mobile
afetaram a capacidade do Google Ads de verificar a qualidade dos anúncios de páginas da Web em iPhones. Duplex na Web
-
User agent em solicitações HTTP Mozilla/5.0 (Linux; Android 11; Pixel 2; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Mobile Safari/537.36
robots.txt Token do user agent no robots.txt DuplexWeb-Google
É possível que o Duplex na Web ignore o caractere curinga
*
.Produtos afetados Compatível com o serviço Duplex na Web. Google Favicon
-
User agent em solicitações HTTP Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon
robots.txt Token do user agent no robots.txt Googlebot-Image
Googlebot
Mobile Apps Android
-
User agent em solicitações HTTP AdsBot-Google-Mobile-Apps
robots.txt Token do user agent no robots.txt AdsBot-Google-Mobile-Apps
O user agent
AdsBot-Google-Mobile-Apps
obedeceu às regras de robôsAdsBot-Google
, mas ignorou o user agent global (*
).Produtos afetados As preferências de rastreamento direcionadas ao user agent AdsBot-Google-Mobile-Apps
afetam a capacidade do Google Ads de verificar a qualidade dos anúncios na página do app Android. Web Light
-
User agent em solicitações HTTP Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19
robots.txt Token do user agent no robots.txt googleweblight
O user agent
googleweblight
era usado somente para solicitações explícitas de navegação de visitantes humanos. Portanto, ele ignorava as regras do robots.txt, que são usadas para bloquear solicitações de rastreamento automatizadas.Produtos afetados O user agent do Web Light verificava a presença do cabeçalho no-transform
sempre que um usuário clicava na página na Pesquisa sob as condições apropriadas.