クローラが Googlebot などの Google クローラであることを確認する
サーバーにアクセスしているウェブクローラが、本当に Google クローラ(Googlebot など)かどうかを確認できる方法があります。この方法は、スパマーなどが Googlebot であると称してサイトにアクセスしていないかを知りたい場合に便利です。
Google のクローラであることを確認するには、次の 2 つの方法があります。
- 手動: 1 回限りのルックアップでは、コマンドライン ツールを使用します。ほとんどの場合、この方法で十分です。
- 自動: 大規模なルックアップでは、自動ソリューションを使用して、公開されている Googlebot の IP アドレスのリストとクローラの IP アドレスを照合します。
コマンドライン ツールを使用する
- ログにアクセスが記録されている IP アドレスについて、
host
コマンドを使用してリバース DNS ルックアップを実施します。 - ドメイン名が
googlebot.com
またはgoogle.com
であることを確認します。 - ステップ 1 で取得したドメイン名で
host
コマンドを使用して、取得したドメイン名について DNS フォワード ルックアップを実施します。 - これがログにアクセスが記録されていた元の IP アドレスと同じかどうかを確認します。
例 1:
host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.host crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com has address 66.249.66.1
例 2:
host 35.247.243.240
240.243.247.35.in-addr.arpa domain name pointer geo-crawl-35-247-243-240.geo.googlebot.com.host geo-crawl-35-247-243-240.geo.googlebot.com
geo-crawl-35-247-243-240.geo.googlebot.com has address 35.247.243.240
例 3:
host 66.249.90.77
77.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.host rate-limited-proxy-66-249-90-77.google.com
rate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77
自動ソリューションを使用する
クローラーの IP アドレスを Googlebot の IP アドレスのリストと照合して、IP アドレスで Googlebot を識別することもできます。このリストにない IP アドレスを使用して Google がサイトにアクセスする場合があります。ユーザー リクエストや Apps Script などのアクセスに使用されている IP アドレスについては、Google の IP アドレスのリストと照合してください。