Google의 일반 크롤러 목록
Google의 일반 크롤러는 Google의 검색 색인을 만들기 위한 정보를 찾고, 다른 제품과 관련된 크롤링을 수행하며, 분석하는 데 사용됩니다. 일반 크롤러는 자동으로 크롤링할 때 항상 robots.txt 규칙을 준수합니다. Google 크롤러의 일반 기술 속성은 일반 크롤러에도 적용됩니다.
일반 크롤러는 일반적으로
googlebot.json 객체, 호스트 이름이 crawl-***-***-***-***.googlebot.com
또는 geo-crawl-***-***-***-***.geo.googlebot.com
인 역방향 DNS 마스크에 게시된 IP 범위에서 크롤링합니다.
다음 목록은 일반 크롤러, HTTP 요청에 표시되는 사용자 에이전트 문자열, robots.txt의 User-agent:
줄에 사용되는 사용자 에이전트 토큰, 크롤러용 크롤링 환경설정의 영향을 받는 제품을 보여줍니다. 일부 크롤러에는 사용자 에이전트 토큰이 두 개 이상 있습니다. 규칙을 적용하려면 크롤러 토큰 하나만 일치시켜야 합니다. 이 목록은 일부일 뿐 전부 포함하지는 않습니다.
로그 파일에 나타날 가능성이 더 높으며 Google에 관련 문의가 접수되는 요청자만 다룹니다.
-
Googlebot
-
HTTP 요청의 User-Agent
Googlebot 스마트폰 Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot 데스크톱 Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36
드물게:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot/2.1 (+http://www.google.com/bot.html)
robots.txt robots.txt의 사용자 에이전트 토큰 Googlebot
robots.txt 그룹 예 user-agent: Googlebot allow: /archive/1Q84 disallow: /archive
영향을 받는 제품 Googlebot
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 Google 검색(디스커버 및 모든 Google 검색 기능 포함) 및 기타 제품(예: Google 이미지, Google 비디오, Google 뉴스, 디스커버)에 영향을 미칩니다. Googlebot 이미지
-
HTTP 요청의 사용자 에이전트 Googlebot-Image/1.0
robots.txt robots.txt의 사용자 에이전트 토큰 Googlebot-Image
Googlebot
robots.txt 그룹 예 user-agent: Googlebot-Image allow: /archive/1Q84 disallow: /archive/moons.jpg
영향을 받는 제품 Googlebot-Image
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 Google 이미지, 디스커버, Google 비디오뿐 아니라 이미지, 로고, favicon이 표시되는 Google 검색의 모든 기능에 영향을 미칩니다. Googlebot 동영상
-
HTTP 요청의 사용자 에이전트 Googlebot-Video/1.0
robots.txt robots.txt의 사용자 에이전트 토큰 Googlebot-Video
Googlebot
robots.txt 그룹 예 user-agent: Googlebot-Video allow: /archive/1Q84 disallow: /archive/
영향을 받는 제품 Googlebot-Video
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 동영상 관련 Google 검색 기능 및 동영상에 종속된 기타 제품에 영향을 미칩니다. Googlebot 뉴스
-
HTTP 요청의 사용자 에이전트 Googlebot-news에는 별도의 HTTP 요청 사용자 에이전트 문자열이 없습니다. 크롤링은 다양한 Googlebot 사용자 에이전트 문자열을 사용하여 실행됩니다. robots.txt robots.txt의 사용자 에이전트 토큰 Googlebot-News
Googlebot
robots.txt 그룹 예 user-agent: Googlebot-News allow: /archive/1Q84 disallow: /archive/
영향을 받는 제품 Googlebot-News
사용자 에이전트에 주소가 지정된 크롤링 환경설정은 Google 뉴스의 모든 표시 경로(예: Google 검색의 뉴스 탭 및 Google 뉴스 앱)에 영향을 미칩니다. Google StoreBot
-
HTTP 요청의 사용자 에이전트 데스크톱 에이전트 Mozilla/5.0 (X11; Linux x86_64; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Safari/537.36
모바일 에이전트 Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36
robots.txt robots.txt의 사용자 에이전트 토큰 Storebot-Google
robots.txt 그룹 예 user-agent: Storebot-Google allow: /archive/1Q84 disallow: /archive/konbini
영향을 받는 제품 Storebot-Google
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 Google 쇼핑의 모든 표시 경로(예: Google 검색 쇼핑 탭 및 Google 쇼핑)에 영향을 미칩니다. Google-InspectionTool
-
HTTP 요청의 사용자 에이전트 데스크톱 에이전트 Mozilla/5.0 (compatible; Google-InspectionTool/1.0;)
모바일 에이전트 Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Google-InspectionTool/1.0;)
robots.txt robots.txt의 사용자 에이전트 토큰 Google-InspectionTool
Googlebot
robots.txt 그룹 예 user-agent: Google-InspectionTool allow: /archive/1Q84 disallow: /archive/
영향을 받는 제품 Google-InspectionTool
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 검색 테스트 도구(예: 리치 결과 테스트 및 Search Console의 URL 검사)에 영향을 미칩니다. Google 검색 또는 기타 제품에는 영향을 미치지 않습니다. GoogleOther
-
HTTP 요청의 사용자 에이전트 Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; GoogleOther)
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GoogleOther) Chrome/W.X.Y.Z Safari/537.36
robots.txt robots.txt의 사용자 에이전트 토큰 GoogleOther
robots.txt 그룹 예 user-agent: GoogleOther allow: /archive/1Q84 disallow: /archive/
영향을 받는 제품 GoogleOther
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 특정 제품에 영향을 미치지 않습니다. GoogleOther는 사이트에서 사용자가 공개적으로 액세스할 수 있는 콘텐츠를 가져오기 위해 여러 제품팀에서 사용할 수 있는 일반적인 크롤러입니다. 예를 들어 내부 연구 및 개발을 위한 일회성 크롤링에 사용할 수 있습니다. Google 검색 또는 기타 제품에는 영향을 미치지 않습니다. GoogleOther-Image
-
HTTP 요청의 사용자 에이전트 GoogleOther-Image/1.0
robots.txt robots.txt의 사용자 에이전트 토큰 GoogleOther-Image
GoogleOther
robots.txt 그룹 예 user-agent: GoogleOther-Image allow: /archive/1Q84 disallow: /archive/moon.jpg
영향을 받는 제품 GoogleOther-Image
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 GoogleOther와 유사한 특정 제품에 영향을 미치지 않습니다. GoogleOther-Image는 공개적으로 액세스할 수 있는 이미지 URL을 가져오는 데 최적화된 GoogleOther 버전입니다. GoogleOther-Video
-
HTTP 요청의 사용자 에이전트 GoogleOther-Video/1.0
robots.txt robots.txt의 사용자 에이전트 토큰 GoogleOther-Video
GoogleOther
robots.txt 그룹 예 user-agent: GoogleOther-Video allow: /archive/1Q84 disallow: /archive
영향을 받는 제품 GoogleOther-Video
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 GoogleOther와 유사한 특정 제품에 영향을 미치지 않습니다. GoogleOther-Video는 공개적으로 액세스할 수 있는 동영상 URL을 가져오는 데 최적화된 GoogleOther 버전입니다. Google-CloudVertexBot
-
HTTP 요청의 사용자 에이전트 하위 문자열 Google-CloudVertexBot
robots.txt robots.txt의 사용자 에이전트 토큰 Google-CloudVertexBot
Googlebot
robots.txt 그룹 예 user-agent: Google-CloudVertexBot allow: /archive/1Q84 disallow: /archive/
영향을 받는 제품 Google-CloudVertexBot
사용자 에이전트로 주소가 지정된 크롤링 환경설정은 사이트 소유자가 Vertex AI 에이전트 빌드를 위해 요청한 크롤링에 영향을 미칩니다. Google 검색 또는 기타 제품에는 영향을 미치지 않습니다. Google-Extended
-
HTTP 요청의 사용자 에이전트 Google-Extended에는 별도의 HTTP 요청 사용자 에이전트 문자열이 없습니다. 크롤링은 기존 Google 사용자 에이전트 문자열을 사용하여 실행됩니다. robots.txt 사용자 에이전트 토큰은 제어 기능으로 사용됩니다. robots.txt robots.txt의 사용자 에이전트 토큰 Google-Extended
robots.txt 그룹 예 user-agent: Google-Extended allow: /archive/1Q84 disallow: /archive/
영향을 받는 제품 Google-Extended
는 웹 게시자가 Gemini 앱 및 Vertex AI 생성형 API(해당 제품을 지원하는 차세대 모델 포함)를 개선하는 데 자신의 사이트가 도움이 되는지 관리하는 데 사용할 수 있는 독립형 제품 토큰입니다. Vertex AI에서 Google 검색을 사용하여 그라운딩할 때 Google-Extended를 허용하지 않는 웹페이지는 그라운딩에 사용되지 않습니다. Google-Extended는 Google 검색에 사이트가 포함될지 여부 또는 순위에 영향을 주지 않습니다.
사용자 에이전트의 Chrome/W.X.Y.Z 관련 참고사항
목록의 사용자 에이전트 문자열에 있는 Chrome/W.X.Y.Z 문자열은 사용자 에이전트가 사용하는 Chrome 브라우저의 버전을 나타내는 자리표시자입니다(예: 41.0.2272.96
). 이 버전 번호는 Googlebot에 사용되는 최신 Chromium 출시 버전에 맞춰 시간이 지남에 따라 증가합니다.
이 패턴이 있는 사용자 에이전트를 대상으로 로그를 검색하거나 서버를 필터링하는 경우 정확한 버전 번호를 지정하기보다는 버전 번호에 와일드 카드를 사용하세요.