2023년 6월 Google 검색엔진 최적화 실무자와의 만남

다음은 2023년 6월 Google 검색엔진 최적화 실무자와의 만남 스크립트입니다. 사이트에 관해 구체적인 도움이 필요하면 Google 검색 센터 도움말 커뮤니티에 질문을 게시해 보세요.

표준 링크를 사용하더라도 Google 디스커버에 신디케이트 버전이 표시됩니다. 이유가 무엇인가요?

존: 베스님의 질문입니다. 우리는 콘텐츠가 신디케이트될 수 있도록 허용합니다. 그러나 표준 링크를 사용하더라도 Google 디스커버에 신디케이션 버전이 여러 번 표시됩니다. 이를 방지하려면 어떻게 해야 하나요?

아주 시의적절한 질문을 해 주셨네요. Google에서는 최근 이 문제를 다루는 데 도움을 드리기 위해 신디케이션 콘텐츠에 관한 안내를 확대했습니다. link rel=canonical은 마치 힌트처럼 Google의 표준화를 도와주는 신호입니다. 콘텐츠가 신디케이트되는 과정에서 신디케이션 버전이 Google 검색에 아예 표시되지 않도록 하려면 신디케이션 버전에도 noindex robots meta 태그를 포함하는 것이 좋습니다. 이렇게 하면 사용자가 페이지에 정상적으로 액세스할 수 있도록 하면서도 신디케이션 콘텐츠가 Google 검색에 표시되는 것을 차단할 수 있습니다.

서로 다른 TLD를 사용하는 두 도메인에서 동일한 키워드에 대해 동일한 국가를 타겟팅해도 괜찮나요?

게리: 사가르님의 질문입니다. 서로 다른 TLD를 사용하는 두 도메인에서 동일한 키워드에 대해 동일한 국가를 타겟팅해도 괜찮나요?

당장 떠오르는 생각으로는, 사용자에게 혼란을 줄 것으로 보입니다. 콘텐츠가 동일한 2개의 도메인이 있다면 혼란을 야기할 수 있습니다. 정책이라는 관점으로 보자면 검색 결과 조작이라고 여겨질 수도 있습니다. Google의 스팸 정책을 확인해 보시기 바랍니다.

Lighthouse JavaScript 경고가 페이지 평가 또는 순위에 영향을 미치나요?

마틴: 아른드님의 질문입니다. 보안 취약점이 있는 라이브러리에 관한 Lighthouse JavaScript 경고가 페이지 평가 또는 순위에 영향을 미치나요?

아른드님, 안녕하세요. 질문해 주셔서 감사합니다. 아니요. 일반적으로 순위에는 영향을 미치지 않지만 보안 경고와 문제는 무시하는 것은 좋은 생각이 아닙니다. 가능한 한 빨리 문제를 해결하시는 것이 좋습니다.

Googlebot이 웹페이지의 특정 섹션을 크롤링하지 못하게 하려면 어떻게 해야 하나요?

존: 션님의 질문입니다. Googlebot이 웹페이지의 특정 섹션을 크롤링하지 못하게 하려면 어떻게 해야 하나요? 제품 페이지에 구매 섹션도 포함되어 있는데 웹사이트에 큰 비중을 차지하지 않는 작은 부가기능이 포함되는 경우가 많습니다.

간단히 답해 드리자면 HTML 페이지 내 특정 섹션에 대한 크롤링만 차단할 수는 없습니다. 하지만 이와 비슷한 결과를 내는 방법이 두 가지 있습니다. data-nosnippet HTML 속성을 사용해 텍스트가 검색 스니펫에 표시되지 않게 할 수도 있고 iframe 또는 소스가 robots.txt에 의해 차단된 JavaScript를 사용할 수도 있습니다. 다만 일반적으로 robot이 사용된 iframe 또는 JavaScript 파일을 사용하는 것은 좋지 않습니다. 크롤링과 색인 생성 과정에서 문제를 야기할 수 있는데, 이 문제를 진단하고 해결하기가 어렵기 때문입니다. 페이지에서 재사용된 콘텐츠에 관한 질문이시라면 걱정하지 않으셔도 됩니다. Googlebot에 이러한 종류의 중복 콘텐츠가 표시되지 않도록 차단하지 않아도 됩니다.

사이트맵을 제출했는데 검색 결과에 표시되지 않습니다. 이유가 무엇인가요?

게리: 익명님의 질문입니다. 사이트맵을 제출했는데 검색 결과에 표시되지 않습니다.

URL에 대해 말씀하시는 것 같네요. 사이트맵은 검색엔진에 콘텐츠가 어디 있는지 알려줄 수 있는 방법 중 하나지만, 사실 그게 거의 답니다. 입력하신 URL이 크롤링된다고 보장할 수는 없으며, 색인이 생성된다고도 절대 보장할 수 없습니다. URL 크롤링이나 색인 생성은 콘텐츠 품질과 인터넷에서의 상대적 인기도에 따라 달라집니다.

Google에서는 구조화된 데이터 오류가 표시되는데 schema.org에는 표시되지 않습니다. 왜 그런가요?

마틴: 코리님의 질문입니다. Google에서는 구조화된 데이터 오류가 표시되는데 schema.org에는 표시되지 않습니다. 왜 그런가요? Google Search Console에는 'returnFees' 필드에 잘못된 enum 값이 있다는 오류가 표시되지만 schema.org 테스트에서는 오류가 없다고 표시됩니다. 조언을 부탁드립니다.

코리님, 질문해 주셔서 감사합니다. schema.org는 구조화된 데이터의 데이터 유형과 속성을 정의하는 개방형 공급업체 독립 항목입니다. 그러나 공급업체로서 Google은 Google 검색의 리치 결과 등 제품 기능의 구조화된 데이터를 사용하기 위해 일부 속성과 유형에 대하여 구체적인 요구사항을 요구할 수 있습니다. schema.org에서 일부 속성을 생략하거나 특정 속성 값의 유형을 사용해도 괜찮습니다. 하지만 Google 및 타사와 같은 공급업체에서는 사용자가 제공하는 구조화된 데이터를 사용하여 기능과 제품을 실제로 개선하기 위하여 좀 더 구체적인 요구사항을 요구할 수 있습니다.

HSTS 등의 보안 헤더 통합이 순위에 영향을 미치나요?

존: 아른드님의 질문입니다. HSTS 등의 보안 헤더 통합이 순위에 영향을 미치나요?

아니요. HSTS 헤더는 Google 검색에 영향을 미치지 않습니다. 이 헤더는 사용자에게 HTTPS 버전에 직접 액세스하라고 안내하기 위한 것으로 일반적으로 HTTPS 버전 리디렉션과 함께 사용됩니다. Google에서는 표준화 프로세스를 사용하여 크롤링 및 색인 생성에 가장 적합한 버전의 페이지를 선택하며 HSTS에 사용되는 것과 같은 헤더를 사용하지 않습니다. 그러나 물론 이러한 헤더를 사용하면 사용자들에게 유용합니다.

Google에서는 XML 사이트맵의 현재 및 이전 버전을 비교하나요?

게리: 빌님의 질문입니다. Google에서는 사이트의 신규 항목 및 삭제된 내용을 파악하기 위해 현재 및 이전 XML 사이트맵 버전을 비교하나요?

확실하게 답해 드리면, 그렇습니다. Google에서는 마지막으로 크롤링된 후 변경되지 않은 사이트맵을 다시 처리하지 않지만 이는 리소스 낭비를 막기 위한 소프트웨어 최적화일 뿐입니다. URL 요소나 lastmod와 같은 요소를 사이트맵에서 변경하면, 사이트맵이 즉시 다시 파싱되며 일반적으로 다시 처리됩니다. 그렇다고 해서 URL이 확실히 크롤링되는 것은 아닙니다. 단지 다른 URL과 마찬가지로 품질 평가 대상이 된다는 의미입니다. 또한 URL이 더 이상 존재하지 않는 등의 이유로 사이트맵에서 URL을 삭제한다고 해서 색인에서 자동으로 삭제되거나 URL이 더욱 빨리 사라지도록 우선적으로 크롤링되는 것은 아닙니다.

XML 사이트맵과 HTML은 어떻게 다른가요? Search Console에 오류 메시지가 표시됩니다.

존: 마로 새미님의 질문입니다. XML 사이트맵과 HTML의 차이점은 무엇인가요? Search Console에 '사이트맵이 HTML 페이지로 노출됩니다. 대신 지원되는 사이트맵 형식을 사용하세요.'라는 메시지가 표시되면 어떻게 해결해야 하나요?

이 문제는 XML 파일과 HTML 페이지 모두에 동일한 이름을 사용하는 경우 발생합니다. HTML 사이트맵은 사용자에게 도움이 될 수 있으며, 더욱 개략적인 지도와도 같습니다. 반면 XML 사이트맵은 크롤러만을 위한 것으로 로봇용으로 만들어진 파일입니다. 제 개인적인 의견을 덧붙이자면, HTML 사이트맵을 사용하면 웹사이트의 탐색이 굉장히 혼란스럽다는 이미지를 줄 수 있습니다. 저라면 사이트맵 페이지를 만드는 대신 이 문제를 해결하기 위해 노력할 것 같습니다.

Google은 파싱 오류가 있는 구조화된 데이터를 어떻게 처리하나요?

게리: 애니메쉬님의 질문입니다. Google은 파싱 오류가 있는 구조화된 데이터를 어떻게 처리하나요?

처리하지 않습니다. 파싱되지 않는 구조화된 데이터가 있으면 Google에서 구조화된 데이터에 포함되어 있을 수 있는 정보를 추출할 수가 없으므로 이 데이터는 무시됩니다.

URL에 숫자가 포함되어 있으면 검색엔진 최적화에 좋지 않은가요? URL에 숫자를 포함시키는 것은 좋지 않은 생각인가요?

존: URL에 숫자가 포함되어 있으면 검색엔진 최적화에 좋지 않은가요? URL에 숫자를 포함시키는 것은 좋지 않은 생각인가요?

아니요. URL에 숫자가 포함되어 있더라도 나쁜 영향을 미치지 않습니다. 숫자나 글자, 라틴어가 아닌 글자를 사용하세요. 원한다면 유니코드 기호도 사용할 수 있습니다. 제가 URL에 사용하지 않을 만한 것이 딱 한 가지 있다면 페이지를 방문할 때마다 변경되는 임시 식별자입니다. 임시 식별자를 사용하면 크롤링이 매우 어렵고 혼란스러워지기 때문입니다.

내 웹사이트 URL이 차단된 이유는 무엇인가요?

게리: 클라우디오님의 질문입니다. 내 웹사이트 URL이 차단된 이유는 무엇인가요?

웹사이트의 URL이 차단된 것은 아닙니다. 다만 순위가 매겨지지 않은 것뿐이죠. 저라면 Google의 SEO 기본 가이드를 참고하여 순위권에 들기 위해 해야 할 일을 알아볼 것 같습니다. 그런 다음 MozAleyda Solis와 같이 잘 알려진 SEO 중심 사이트 및 전문가들의 팁을 확인할 것 같네요.

'색인 팽창'이 실제로 Google 크롤링 및 색인 생성에 영향을 주나요?

존: '색인 팽창'은 실제로 일어나는 현상인가요? Google 크롤링과 색인 생성에 영향을 주나요?

Google에서는 색인 팽창이라는 개념이 알려지지 않았습니다. Google 시스템에서는 사이트에서 색인이 생성되는 페이지 개수를 인위적으로 제한하지 않습니다. 색인 생성을 위해 제공하는 페이지가 실제로 유용한 페이지인지는 확인하시는 것이 좋겠지만, 이는 사이트에 페이지가 몇 개나 있는지와는 관계 없습니다.

Googlebot이 내 사이트에 영구적으로 접근하지 못하도록 완전히 차단하려면 어떻게 해야 하나요?

게리: Googlebot이 내 사이트에 영구적으로 접근하지 못하도록 완전히 차단하려면 어떻게 해야 하나요? 몇 달 정도가 아니라 영원히 접근하지 못하게 하고 싶습니다.

가장 간단한 방법은 robots.txt입니다. Googlebot 사용자 에이전트에 disallow: /를 추가하면 해당 규칙을 유지하는 동안에는 Googlebot이 사이트에 접근하지 않습니다. 네트워크 액세스까지 차단하려면 Googlebot의 IP 범위를 거부 규칙에 로드하는 방화벽 규칙을 만들어야 합니다. Googlebot 확인 문서에서 Googlebot의 IP 주소 목록을 확인할 수 있습니다.

검색엔진 최적화 회사가 Google 공인 배지를 받을 수 있나요?

존: 마이클님의 질문입니다. 검색엔진 최적화 회사가 Google 공인 배지를 받을 수 있나요?

Google 검색엔진 최적화 인증이 무엇인지 모르겠네요. Google Ads와 같은 일부 제품에 대한 인증은 있지만 검색엔진 최적화에 대한 인증은 모르겠습니다. 공식 인증의 경우, 저라면 다른 사람의 말을 믿기보다는 직접 출처를 다시 확인해 보세요.

탐색 메뉴가 여러 개면 검색엔진 최적화 성능이 저하될 수 있나요?

게리: 익명님의 질문입니다. 탐색 메뉴를 여러 개 사용하면 검색엔진 최적화 성능이 저하될 수 있나요? 사이트의 중요한 카테고리를 대부분 포함하는 기본 메뉴가 있고, 브랜드 확장과 관련된 카테고리를 강화하는 '보조' 메뉴가 있습니다.

탐색 메뉴가 여러 개여도 사이트의 검색엔진 최적화 성능에 영향을 미칠 가능성은 매우 낮습니다.

HTML 및 ASPX 페이지의 색인을 생성하려고 했지만 일부 HTML 페이지의 색인만 생성되었습니다. 도와주세요!

존: HTML 및 ASPX 페이지의 색인을 생성하려고 했지만 일부 HTML 페이지의 색인만 생성되었습니다. 도와주세요.

Google에 있어서는 이러한 파일 끝부분이 아무런 의미를 갖지 않습니다. 끝부분이 이러한 URL은 일반 HTML 페이지일 수도 있고, 따라서 Google에서 색인을 생성할 수 있습니다. 이러한 끝부분을 숨기더라도 Google 시스템에서 어떠한 요소도 바뀌지 않습니다. 크롤링 및 색인 생성에 관한 일반적인 질문은 도움말 커뮤니티를 참고하시는 것이 좋습니다. 유용한 정보를 확인해 보세요.

같은 도메인에 있는 2개의 웹페이지에 관한 검색 결과 2개가 표시되는데, 두 번째 검색 결과가 약간 들여쓰기되어 있습니다. 이유가 무엇인가요?

게리: 쉰님의 질문입니다. 같은 도메인에 있는 2개의 웹페이지에 관한 검색 결과 2개가 표시되는데, 두 번째 검색 결과가 약간 들여쓰기되어 있습니다. 이유가 무엇인가요?

이를 호스트 그룹이라고 합니다. 마크업으로 호스트 그룹에 실제로 영향을 줄 수는 없지만 특정 검색어에 대해 순위가 높은 페이지가 2개 이상 있음을 알려주는 것이라고 볼 수 있습니다. 가능하면 이 두 페이지를 통합하는 것이 좋습니다. 호스트 그룹에 관한 자세한 내용은 시각적 요소 갤러리를 참고하세요.

가짜 Googlebot이 허용되나요? 공식 URL처럼 표시되지만 IP 주소가 다릅니다.

존: 아른드님의 질문입니다. 가짜 Googlebot이 허용되나요? 공식 URL처럼 표시되지만 IP 주소가 다릅니다.

누구든지 사용자 에이전트 이름을 자유롭게 지정할 수 있고, 합법적인 것처럼 보이도록 스크립트에서 Googlebot 사용자 에이전트 이름을 사용하는 경우도 있습니다. Google 도움말에는 Googlebot이 사용하는 IP 범위 및 요청이 합법적인지 확인하는 방법이 게시되어 있습니다. 아른드님이 알려주신 가짜 Googlebot의 경우 IP 주소가 독일의 호스팅 업체인 Hetzner Online으로 다시 매핑됩니다. 이러한 요청이 많다면 악용사례 담당 부서에 문의하시는 것이 좋습니다.

도메인 이름 대신 IP 주소를 거부할 방법이 있나요?

게리: 무하마드님의 질문입니다. 도메인 이름 대신 IP 주소를 거부할 방법이 있을까요?

아니요. 없습니다.

Blogger에서 흔히 볼 수 있는 NOODP의 용도는 무엇인가요?

존: Blogger에서 흔히 볼 수 있는 NOODP의 용도는 무엇인가요?

과거의 흔적입니다. Google은 아주 오랫동안 이 robots meta 태그를 사용하지 않았습니다. NOODP는 이전에 진행된 DMOZ 공개 디렉터리 프로젝트에서 사용되었는데, 당시에는 사이트와 함께 짧은 설명이 표시되었습니다. meta 태그는 검색엔진에 이러한 설명을 무시하라고 명령합니다. 공개 디렉터리 프로젝트(ODP)는 더 이상 존재하지 않으며 이 meta 태그도 효과가 없습니다. 아무런 문제가 발생하지 않으므로 그대로 두어도 괜찮습니다.

'주요 콘텐츠'란 동영상이 페이지의 첫 번째 요소가 되어야 한다는 의미인가요?

게리: 프레드릭님의 질문입니다. 4월 13일부터 SERP에 썸네일이 표시되려면 동영상이 페이지의 주요 콘텐츠여야 한다고 하는데 '주요 콘텐츠'란 동영상이 페이지의 첫 번째 요소가 되어야 한다는 의미인가요?

아니요. 사용자의 관점에서 생각하세요. 사용자가 페이지에 도착했을 때 눈앞에 동영상이 바로 표시되는 것이 아니라 동영상이 어디에 있는지 적극적으로 찾아야 한다고 생각해 봅시다. 이건 꽤 혼란스러운 경험이죠. 그래서 Google에서는 사용자 눈앞에 표시되는 주요 콘텐츠, 동영상을 원하는 것입니다. Vimeo 또는 YouTube와 같은 대규모 동영상 사이트를 보면 알고리즘이 무엇을 원하는지 파악할 수 있습니다.