Google の特殊なケース用のクローラーの一覧
特殊なケース用のクローラーは、クロールされるサイトとサービス間でクロール プロセスに関して合意がある、特定のサービスで使用されます。たとえば、AdsBot
は広告パブリッシャーの許可に基づき、グローバル robots.txt ユーザー エージェント(*
)を無視します。Google クローラーの一般的な技術的特性は、特殊なケース用のクローラーにも適用されます。
特殊なケース用のクローラーは robots.txt ルールを無視して、一般的なクローラーとは異なる IP 範囲でクロールを実施する場合があります。IP 範囲は special-crawlers.json オブジェクトで公開されています。特殊なケース用のクローラーのリバース DNS マスクは rate-limited-proxy-***-***-***-***.google.com
と一致します。
次のリストには、特殊なケース用のクローラー、HTTP リクエストに表示されるユーザー エージェント文字列、robots.txt の User-agent:
行のユーザー エージェント トークン、そしてそのクローラーのクロール設定によって影響を受けるプロダクトが示されています。このリストはすべてを網羅しているわけではなく、ログファイルに表示される可能性が高く、質問を受けているリクエスト送信者のみを記載しています。
APIs-Google
-
HTTP リクエストのユーザー エージェント APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)
robots.txt robots.txt のユーザー エージェント トークン APIs-Google
グローバル ユーザー エージェント(
*
)は無視されます。robots.txt グループの例 user-agent: APIs-Google allow: /archive/1Q84 disallow: /archive/
影響を受けるプロダクト APIs-Google
ユーザー エージェントに対するクロール設定は、Google API によるプッシュ通知メッセージの配信に影響します。 モバイルウェブ用 AdsBot
-
HTTP リクエストのユーザー エージェント Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt robots.txt のユーザー エージェント トークン AdsBot-Google-Mobile
グローバル ユーザー エージェント(
*
)は無視されます。robots.txt グループの例 user-agent: AdsBot-Google-Mobile allow: /archive/1Q84 disallow: /archive/
影響を受けるプロダクト AdsBot-Google-Mobile
ユーザー エージェントに対するクロール設定は、Google 広告がウェブページの広告品質をチェックする機能に影響します。 AdsBot
-
HTTP リクエストのユーザー エージェント AdsBot-Google (+http://www.google.com/adsbot.html)
robots.txt robots.txt のユーザー エージェント トークン AdsBot-Google
グローバル ユーザー エージェント(
*
)は無視されます。robots.txt グループの例 user-agent: AdsBot-Google allow: /archive/1Q84 disallow: /archive/
影響を受けるプロダクト AdsBot-Google
ユーザー エージェントに対するクロール設定は、Google 広告がウェブページの広告品質をチェックする機能に影響します。 AdSense
-
HTTP リクエストのユーザー エージェント デスクトップ エージェント Mediapartners-Google
モバイル エージェント (Various mobile device types) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)
robots.txt robots.txt のユーザー エージェント トークン Mediapartners-Google
グローバル ユーザー エージェント(
*
)は無視されます。robots.txt グループの例 user-agent: Mediapartners-Google allow: /archive/1Q84 disallow: /archive/
影響を受けるプロダクト Mediapartners-Google
ユーザー エージェントに対するクロール設定は、Google AdSense に影響します。AdSense クローラは、関連性の高い広告を配信するために参加サイトにアクセスします。 Google-Safety
-
HTTP リクエストのユーザー エージェント Google-Safety
robots.txt Google-Safety のユーザー エージェントは robots.txt ルールを無視します。 影響を受けるプロダクト Google-Safety ユーザー エージェントは、Google サービスで一般公開されたリンクに対するマルウェアの検出など、不正行為に固有のクロールを処理します。そのため、クロール設定の影響を受けません。
廃止された特殊なケース用のクローラー
以下の特殊なケース用のクローラーは使用されなくなりました。あくまで参考のためにここに列挙しています。
モバイルウェブ用 AdsBot
-
HTTP リクエストのユーザー エージェント Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Mobile/15E148 Safari/604.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt robots.txt のユーザー エージェント トークン AdsBot-Google-Mobile
グローバル ユーザー エージェント(
*
)は無視されます。影響を受けるプロダクト AdsBot-Google-Mobile
ユーザー エージェントに対するクロール設定は、Google 広告が iPhone のウェブページの広告品質をチェックする機能に影響しました。 ウェブ上の Duplex
-
HTTP リクエストのユーザー エージェント Mozilla/5.0 (Linux; Android 11; Pixel 2; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Mobile Safari/537.36
robots.txt robots.txt のユーザー エージェント トークン DuplexWeb-Google
ウェブ上の Duplex は、
*
ワイルドカードを無視する場合があります。影響を受けるプロダクト 「ウェブ上の Duplex」サービスをサポートしていました。 Google Favicon
-
HTTP リクエストのユーザー エージェント Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon
robots.txt robots.txt のユーザー エージェント トークン Googlebot-Image
Googlebot
モバイルアプリ Android
-
HTTP リクエストのユーザー エージェント AdsBot-Google-Mobile-Apps
robots.txt robots.txt のユーザー エージェント トークン AdsBot-Google-Mobile-Apps
AdsBot-Google-Mobile-Apps
ユーザー エージェントはAdsBot-Google
ロボットルールに従いましたが、グローバル ユーザー エージェント(*
)については無視しました。影響を受けるプロダクト AdsBot-Google-Mobile-Apps
ユーザー エージェントに対するクロール設定は、Google 広告が Android アプリページの広告品質をチェックする機能に影響します。 Web Light
-
HTTP リクエストのユーザー エージェント Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19
robots.txt robots.txt のユーザー エージェント トークン googleweblight
googleweblight
ユーザー エージェントは、人間の訪問者による明示的な閲覧リクエストにのみ使用され、自動クロール リクエストをブロックするための robots.txt ルールは無視していました。影響を受けるプロダクト Web Light ユーザー エージェントは、該当する条件下の検索でユーザーがページをクリックするたびに no-transform
ヘッダーの存在を確認しました。