รายการ Crawler ทั่วไปของ Google
Crawler ทั่วไปของ Google ใช้เพื่อค้นหาข้อมูลสำหรับสร้างดัชนีการค้นหาของ Google, ทำการ Crawl เฉพาะสำหรับผลิตภัณฑ์อื่นๆ และใช้สำหรับการวิเคราะห์ Crawler ประเภทนี้จะทําตามกฎของ robots.txt เสมอเมื่อทำการ Crawl โดยอัตโนมัติ คุณสมบัติทางเทคนิคทั่วไปของ Crawler ของ Google ยังนำไปใช้กับ Crawler ทั่วไปด้วย
โดยปกติ Crawler ทั่วไปจะทำการ Crawl จากช่วง IP ที่เผยแพร่ในออบเจ็กต์ googlebot.json และมาสก์ DNS แบบย้อนกลับของชื่อโฮสต์จะตรงกับ crawl-***-***-***-***.googlebot.com
หรือ geo-crawl-***-***-***-***.geo.googlebot.com
รายการต่อไปนี้แสดง Crawler ทั่วไป สตริง User Agent ของ Crawler ตามที่ปรากฏในคำขอ HTTP, โทเค็น User Agent ของ Crawler สำหรับบรรทัด User-agent:
ใน robots.txt และผลิตภัณฑ์ที่ได้รับผลกระทบจากการกำหนดค่าการ Crawl สำหรับ Crawler Crawler บางตัวมีโทเค็น User Agent มากกว่า 1 รายการ คุณต้องจับคู่โทเค็น Crawler เพียง 1 รายการเท่านั้นเพื่อใช้กฎ รายการนี้เป็นเพียงตัวอย่างบางส่วนเท่านั้น โดยครอบคลุมผู้ขอซึ่งมีแนวโน้มที่จะปรากฏในไฟล์บันทึกและที่เราได้รับคำถามมา
-
Googlebot
-
User-Agent
ในคำขอ HTTPGooglebot Smartphone Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot Desktop Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36
น้อยครั้ง:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot/2.1 (+http://www.google.com/bot.html)
robots.txt โทเค็น User Agent ใน robots.txt Googlebot
ตัวอย่างกลุ่ม robots.txt user-agent: Googlebot allow: /archive/1Q84 disallow: /archive
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Googlebot
จะส่งผลต่อ Google Search (รวมถึงฟีเจอร์สำรวจและฟีเจอร์ทั้งหมดของ Google Search) รวมถึงผลิตภัณฑ์อื่นๆ เช่น Google รูปภาพ, Google วิดีโอ, Google News และสำรวจ Googlebot Image
-
User Agent ในคําขอ HTTP Googlebot-Image/1.0
robots.txt โทเค็น User Agent ใน robots.txt Googlebot-Image
Googlebot
ตัวอย่างกลุ่ม robots.txt user-agent: Googlebot-Image allow: /archive/1Q84 disallow: /archive/moons.jpg
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Googlebot-Image
จะส่งผลต่อ Google รูปภาพ, สำรวจ, Google วิดีโอ และฟีเจอร์ทั้งหมดใน Google Search ที่แสดงรูปภาพ โลโก้ และ Favicon Googlebot Video
-
User Agent ในคําขอ HTTP Googlebot-Video/1.0
robots.txt โทเค็น User Agent ใน robots.txt Googlebot-Video
Googlebot
ตัวอย่างกลุ่ม robots.txt user-agent: Googlebot-Video allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ส่งถึง User Agent Googlebot-Video
จะส่งผลต่อฟีเจอร์ของ Google Search ที่เกี่ยวข้องกับวิดีโอและผลิตภัณฑ์อื่นๆ ที่อาศัยวิดีโอ Googlebot News
-
User Agent ในคําขอ HTTP Googlebot-news ไม่มีสตริง User Agent ของคำขอ HTTP แยกต่างหาก การ Crawl จะดําเนินการด้วยสตริง User Agent หลายรายการของ Googlebot robots.txt โทเค็น User Agent ใน robots.txt Googlebot-News
Googlebot
ตัวอย่างกลุ่ม robots.txt user-agent: Googlebot-News allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ การตั้งค่าการ Crawl ที่ส่งถึง User Agent ของ Googlebot-News
จะมีผลต่อทุกแพลตฟอร์มของ Google News (เช่น แท็บ News ใน Google Search และแอป Google News) Google StoreBot
-
User Agent ในคําขอ HTTP Agent ในเดสก์ท็อป Mozilla/5.0 (X11; Linux x86_64; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Safari/537.36
Agent ในอุปกรณ์เคลื่อนที่ Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36
robots.txt โทเค็น User Agent ใน robots.txt Storebot-Google
ตัวอย่างกลุ่ม robots.txt user-agent: Storebot-Google allow: /archive/1Q84 disallow: /archive/konbini
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent Storebot-Google
จะส่งผลต่อทุกแพลตฟอร์มของ Google Shopping (เช่น แท็บ Shopping ใน Google Search และ Google Shopping) Google-InspectionTool
-
User Agent ในคําขอ HTTP Agent ในเดสก์ท็อป Mozilla/5.0 (compatible; Google-InspectionTool/1.0;)
Agent ในอุปกรณ์เคลื่อนที่ Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Google-InspectionTool/1.0;)
robots.txt โทเค็น User Agent ใน robots.txt Google-InspectionTool
Googlebot
ตัวอย่างกลุ่ม robots.txt user-agent: Google-InspectionTool allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ส่งถึง User Agent Google-InspectionTool
จะส่งผลต่อเครื่องมือทดสอบต่างๆ ของ Search เช่น การทดสอบผลการค้นหาที่เป็นริชมีเดียและการตรวจสอบ URL ใน Search Console โดยไม่มีผลต่อ Google Search หรือผลิตภัณฑ์อื่นๆ GoogleOther
-
User Agent ในคําขอ HTTP Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; GoogleOther)
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GoogleOther) Chrome/W.X.Y.Z Safari/537.36
robots.txt โทเค็น User Agent ใน robots.txt GoogleOther
ตัวอย่างกลุ่ม robots.txt user-agent: GoogleOther allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ระบุสำหรับ User Agent GoogleOther
จะไม่ส่งผลต่อผลิตภัณฑ์ใดโดยเฉพาะ GoogleOther เป็น Crawler ทั่วไปที่ทีมผลิตภัณฑ์ต่างๆ อาจใช้เพื่อดึงเนื้อหาที่เข้าถึงได้แบบสาธารณะจากเว็บไซต์ เช่น ใช้สําหรับทำการ Crawl เพียงครั้งเดียวสำหรับการค้นคว้าและพัฒนาภายใน โดยไม่มีผลต่อ Google Search หรือผลิตภัณฑ์อื่นๆ GoogleOther-Image
-
User Agent ในคําขอ HTTP GoogleOther-Image/1.0
robots.txt โทเค็น User Agent ใน robots.txt GoogleOther-Image
GoogleOther
ตัวอย่างกลุ่ม robots.txt user-agent: GoogleOther-Image allow: /archive/1Q84 disallow: /archive/moon.jpg
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ส่งถึง User Agent ของ GoogleOther-Image
จะไม่ส่งผลต่อผลิตภัณฑ์ใดผลิตภัณฑ์หนึ่งโดยเฉพาะ เช่นเดียวกับ GoogleOther GoogleOther-Image คือ GoogleOther เวอร์ชันที่ได้รับการเพิ่มประสิทธิภาพสำหรับการดึงข้อมูล URL รูปภาพที่เข้าถึงได้แบบสาธารณะ GoogleOther-Video
-
User Agent ในคําขอ HTTP GoogleOther-Video/1.0
robots.txt โทเค็น User Agent ใน robots.txt GoogleOther-Video
GoogleOther
ตัวอย่างกลุ่ม robots.txt user-agent: GoogleOther-Video allow: /archive/1Q84 disallow: /archive
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ GoogleOther-Video
ไม่มีผลต่อผลิตภัณฑ์ที่เฉพาะเจาะจงใดๆ ซึ่งคล้ายกับ GoogleOther GoogleOther-Video คือ GoogleOther เวอร์ชันที่ได้รับการเพิ่มประสิทธิภาพสำหรับการดึงข้อมูล URL ของวิดีโอที่เข้าถึงได้แบบสาธารณะ Google-CloudVertexBot
-
สตริงย่อย User-Agent ในคําขอ HTTP Google-CloudVertexBot
robots.txt โทเค็น User Agent ใน robots.txt Google-CloudVertexBot
Googlebot
ตัวอย่างกลุ่ม robots.txt user-agent: Google-CloudVertexBot allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Google-CloudVertexBot
มีผลต่อการ Crawl ที่เจ้าของเว็บไซต์ขอ สำหรับการสร้าง Vertex AI Agent โดยไม่มีผลต่อ Google Search หรือผลิตภัณฑ์อื่นๆ Google-Extended
-
User Agent ในคําขอ HTTP Google-Extended ไม่มีสตริง User Agent ของคำขอ HTTP แยกต่างหาก การ Crawl จะดําเนินการด้วยสตริง User Agent ของ Google ที่มีอยู่ มีการใช้ โทเค็น User Agent ของ robots.txt ในความสามารถในการควบคุม robots.txt โทเค็น User Agent ใน robots.txt Google-Extended
ตัวอย่างกลุ่ม robots.txt user-agent: Google-Extended allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ Google-Extended
เป็นโทเค็นผลิตภัณฑ์แบบสแตนด์อโลนซึ่งทำหน้าที่เป็นส่วนควบคุมใหม่ที่ผู้เผยแพร่เว็บสามารถใช้จัดการว่าจะให้เว็บไซต์ของตนช่วยปรับปรุงแอป Gemini และ Vertex AI Generative API รวมถึงโมเดลรุ่นใหม่ๆ ที่ขับเคลื่อนผลิตภัณฑ์เหล่านั้นหรือไม่ Google-Extended ไม่ส่งผลต่อการรวมหรือการจัดอันดับเว็บไซต์ใน Google Search
หมายเหตุเกี่ยวกับW.X.Y.Z ใน User Agent
เมื่อใดที่เห็นสตริง Chrome/W.X.Y.Z ในสตริง User Agent ในตาราง W.X.Y.Z คือตัวยึดตำแหน่งจริงๆ ที่แสดงถึงเวอร์ชันของเบราว์เซอร์ Chrome ที่ใช้โดย User Agent ดังกล่าว เช่น 41.0.2272.96
หมายเลขเวอร์ชันนี้จะเพิ่มขึ้นเมื่อเวลาผ่านไปเพื่อจับคู่กับ Chromium เวอร์ชันที่เผยแพร่ล่าสุดซึ่ง Googlebot ใช้
หากกำลังค้นหาบันทึกหรือกรองเซิร์ฟเวอร์สำหรับ User Agent ที่มีรูปแบบนี้ ให้ใช้ไวลด์การ์ดหมายเลขเวอร์ชันแทนการระบุหมายเลขเวอร์ชันที่ถูกต้อง