Google tarayıcıları ve alıcılarından gelen istekleri doğrulama
Sunucunuza gönderilen bir isteğin gerçekten Google'dan olup olmadığını doğrulayabilirsiniz. Googlebot gibi tarayıcılar ve diğer istekler için doğrulama mümkündür. Spam yapanların veya kötü niyetli başka kişilerin Google'dan olduklarını iddia ederek sitenize eriştiğinden şüpheleniyorsanız bu yararlı bir yöntemdir.
Google tarayıcıları ve alıcıları üç kategoriye ayrılır:
| Tür | Açıklama | Ters DNS maskesi | IP aralıkları |
|---|---|---|---|
| Yaygın kullanılan tarayıcılar | Google ürünleri için kullanılan genel tarayıcılar (Googlebot gibi). Otomatik taramalar için robots.txt kurallarına her zaman uyarlar. |
crawl-***-***-***-***.googlebot.com veya geo-crawl-***-***-***-***.geo.googlebot.com
|
common-crawlers.json |
| Özel durum tarayıcıları | Taranan site ile ürün arasında erişimle ilgili veya kötüye kullanıma özel tarama ya da getirme ile ilgili bir anlaşma olduğunda Google ürünleri (ör. AdsBot) için belirli işlevleri gerçekleştiren tarayıcılar veya alıcılar. Bu tarayıcılar veya alıcılar robots.txt kurallarına uyabilir veya uymayabilir. | rate-limited-proxy-***-***-***-***.google.com |
special-crawlers.json |
| Kullanıcının tetiklediği alıcılar |
Son kullanıcının, getirme işlemini tetiklediği araçlar ve ürün işlevleri. Örneğin,
Google Site Doğrulayıcı
bir kullanıcının isteği üzerine işlem yapar. Getirme, bir kullanıcı tarafından istendiğinden bu getirme araçları robots.txt
kurallarını yoksayar. . Google tarafından kontrol edilen alıcılar user-triggered-fetchers-google.json nesnesindeki IP'lerden gelir ve
google.com ana makine adına çözümlenir. user-triggered-fetchers.json nesnesindeki IP'ler
gae.googleusercontent.com ana makine adına çözümlenir. Bu IP'lerin kullanımına örnek olarak Google Cloud'da (GCP) çalışan bir sitede harici RSS özet akışlarını getirmeyi gerektiren bir özelliğin kullanıcı tarafından istenmesi verilebilir.
|
***-***-***-***.gae.googleusercontent.com veya
google-proxy-***-***-***-***.google.com
|
user-triggered-fetchers.json, user-triggered-fetchers-google.json, ve user-triggered-agents.json |
Google'dan gelen istekleri doğrulamanın iki yöntemi vardır:
- Manuel olarak: Tek seferlik aramalarda komut satırı araçlarını kullanın. Bu yöntem çoğu kullanım alanı için yeterlidir.
- Otomatik olarak: Büyük ölçekli aramalarda tarayıcının IP adresini, yayınlanan Google IP adresleri listesiyle eşleştirmek için otomatik bir çözüm kullanın.
Komut satırı araçlarını kullanma
-
Günlüklerinizde, erişimde bulunan IP adresi için
hostkomutunu kullanarak ters DNS araması çalıştırın. -
Alan adının
googlebot.com,google.comveyagoogleusercontent.comolduğunu doğrulayın. -
1. adımda aldığınız alan adı için yönlendirilmiş DNS araması çalıştırın. Bunun için, alınan alan adında
hostkomutunu kullanın. - Bunun, günlüklerinizde kayıtlı, orijinal erişimde bulunan IP adresiyle aynı olduğunu doğrulayın.
Örnek 1:
host 66.249.66.11.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.host crawl-66-249-66-1.googlebot.comcrawl-66-249-66-1.googlebot.com has address 66.249.66.1
Örnek 2:
host 35.247.243.240240.243.247.35.in-addr.arpa domain name pointer geo-crawl-35-247-243-240.geo.googlebot.com.host geo-crawl-35-247-243-240.geo.googlebot.comgeo-crawl-35-247-243-240.geo.googlebot.com has address 35.247.243.240
Örnek 3:
host 66.249.90.7777.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.host rate-limited-proxy-66-249-90-77.google.comrate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77
Otomatik çözümleri kullanma
Alternatif olarak da tarayıcının IP adresini, Google tarayıcılarının ve getirme araçlarının IP aralıkları listeleriyle eşleştirerek Googlebot'u IP adresine göre tanımlayabilirsiniz:
- Googlebot gibi genel tarayıcılar
- AdsBot gibi özel tarayıcılar
- Kullanıcının tetiklediği alıcılar (kullanıcılar)
- Kullanıcının tetiklediği alıcılar (Google)
- Kullanıcının tetiklediği aracılar
Sitenizin erişilebildiği diğer Google IP adresleri için (örneğin, Apps Komut Dosyaları) erişim IP adresini genel Google IP adres listesi ile eşleştirin. JSON dosyalarındaki IP adreslerinin CIDR biçiminde gösterildiğini unutmayın.