ベータ版: 検索セントラルの一部のページで、AI 搭載のチャットインターフェースをテスト中です。サイドパネルにチャットアイコンが表示されていたら、ぜひこの機能を試して感想をお聞かせください。詳しくは、サイドパネルチャットの提供状況をご確認ください。

2023 年 9 月 Google SEO オフィスアワー

これは 2023 年 9 月の Google SEO オフィスアワーの文字起こしです。サイト固有のヘルプを得るには、Google 検索セントラルのヘルプコミュニティに質問を投稿することをおすすめします。

私のウェブサイトの www バージョンがインデックスに登録されていますが、これは Google の誤りですか？

John: Wan さんからの質問です。「Google が私のウェブサイトの www バージョンを間違ってインデックスに登録しています。正しいページは、www なしで HTTP の後にドメイン名 .my です。」

Wan さん、ページを見てみましたが、サーバーが自動的に www なしのバージョンから www ありのバージョンにリダイレクトしています。リンクの「rel canonical」要素は適切に設定されているようです。Chrome を使用している場合、一見 www がないように見えるかもしれませんが、ブラウザ上部の URL を 2 回クリックすると www ありの完全な URL が表示されます。実用上の問題はありません。サイトの www ありバージョンと www なしバージョンのどちらも Google 検索で問題なく扱われます。www だらけですね！

Search Console でフィルタ済みデータがデータ全体よりも上位なのはなぜですか？

Gary: Ornella さんからの質問です。「Search Console でフィルタ済みデータがデータ全体よりも上位なのはなぜですか？理屈がわかりません。」

いい質問です。ただ、おそらく理由は異なります。簡潔に答えると、大量のデータを扱うために Bloom フィルタというものを多用しているからです。Bloom フィルタを使うと時間とストレージを大幅に節約できます。詳しく答えると、大量のデータを扱うために Bloom フィルタというものを多用しているからだということに変わりはありませんが、Bloom フィルタについてもう少し説明します。セット内の大量のアイテム、つまり何兆個とは言わないまでも何十億個ものアイテムを扱う場合、検索に時間がかかってしまいます。そこで便利なのが Bloom フィルタです。Bloom フィルタを使うと、メインセットに含まれる可能性のあるアイテムのハッシュを含む別のセットを参照することができ、そこでデータを調べることができます。最初にハッシュを調べるのでかなり高速になりますが、ハッシュは意図的かどうかを問わずデータロスを伴う場合があります。このデータの欠落が、あなたが経験している事象です。通過するデータが少ないと、メインセットに存在するかどうかについての予測精度が高まります。基本的に Bloom フィルタは、データセットに存在するかどうかを予測することでルックアップを高速化しますが、その分精度は落ちてしまいます。データセットが小さいほど予測精度は高まります。

私の Google サイトのウェブサイトのページが正しくインデックスに登録されていないのはなぜですか？

John: フランス語で投稿された質問で「私の Google サイトのウェブサイトのページが正しくインデックスに登録されていないのはなぜか」というものでした。

他の言語での質問は嬉しいですね。まず、Google サイトで作成されたウェブサイトは、Google 検索でインデックスに登録できますし、実際に登録されています。しかし、Google サイトで使用されている URL は、公開バージョンとログイン時に表示される URL が異なることがあるため、追跡するのが少し困難です。率直に言うと、技術的にはインデックス登録可能です。ただし、SEO の面では最適ではなく、Search Console での追跡は複雑です。SEO を第一に考えるのであれば、他の選択肢を検討し、事前に長所と短所を確認することをおすすめします。Search Console でパフォーマンスを追跡するために、Google サイトコンテンツで独自ドメイン名を使用することもできます。独自ドメイン名を使用することで、移行が容易になり、Search Console でドメイン全体の所有権を確認できます。

ウェブサイトに複数のボタンがあり、クリックすると他のページへのリンクをフェッチします。Google はこれらのリンクをクロールできますか？

Gary: Sarabjit さんからの質問です。「ウェブサイトに複数のボタンがあり、クリックすると他のページへのリンクをフェッチします。Google はこれらのリンクをクロールできますか？」

通常、Googlebot ではボタンはクリックされません。

バックリンクを獲得するための「ゲスト投稿」は Google のガイドラインに反しますか？コンテンツ自体は意味のあるものが書かれています。

John: Brooke さんからの質問です。「最近、多くのウェブサイトで、バックリンクを獲得するための『ゲスト投稿』を購入するオプションのみが提供されています。意味のあるコンテンツが書かれていたとしても、これは Google のガイドラインに反するのでしょうか？」

Brooke さん、ご質問ありがとうございます。適切にお考えいただいているようです。リンクのためにゲスト投稿を利用することはスパムに関するポリシーに反しています。特に、検索結果に影響を与えないことを示すようにしてリンクを修飾することが重要です。これは、リンクの rel=nofollow または rel=sponsored 属性で行うことができます。サイトを宣伝するために広告を使用するのは問題ありませんが、ご指摘のようにリンクはブロックしなければなりません。

e コマースのカテゴリページのコンテンツは、全体的なランキングを向上させるのに有効ですか？

Gary: Brooke さんからの質問です。「e コマースのカテゴリページのコンテンツは、全体的なランキングを向上させるのに有効ですか？」

自分のページにはどんなコンテンツでも自由に追加できます。しかし、自動生成された低品質な繰り返しの文章を、すべてのカテゴリページに何度も追加することはしないでください。一般のユーザーからも意味がないものに見えます。自分のページにコンテンツが必要な場合は、実際に役に立つコンテンツを追加しましょう。検索に必要、あるいは必要だと思われるという理由でコンテンツを追加しないでください。e コマースに関するおすすめの方法も確認してください。

セマンティックタグが不正確な場合、Google のウェブサイトコンテンツに対する理解度は低下しますか？

John: 「セマンティックタグが不正確な場合、Google のウェブサイトコンテンツに対する全体的な理解度が低下し、ブランチに割り当てる能力も低下しますか？特に <hr> タグは、トピックの変更を示すものですが、私はデザイン上の目的でしか使わないかもしれません。」

興味深い質問です。一般的に、セマンティック HTML が正しく使われていると、検索エンジンはページのコンテンツやコンテキストをより適切に理解できます。たとえば、ページの見出しをマークアップすれば、あなたがその見出しとコンテンツが一致していると考えていることを明確に示せます。ランキングトップになる裏技ではありませんが、テキストで伝えたいことがわかりづらい場合、見出しという形で明確な要約を提供することは助けになります。Google がページをどれだけ理解できるかに左右される微妙な問題なので、すべてをカバーしているか確認することをおすすめします。逆に、正確なセマンティック HTML から不正確なセマンティック HTML にするのも微妙な問題です。それでも検索エンジンがページを理解できているのであれば、理解の仕方に差は出ないでしょう。意味が突然あいまいになってるのであれば、セマンティック構造を使うなどして意味を明確にできるかもしれません。例に挙げられている <hr> タグについては、不正確に使用したからといって、ページの理解に差が出るような状況は考えられません。不正確な使用の形は無限にありますが、ウェブデザイナーが <hr> タグでうっかりしてしまいそうなことであれば、問題にはならないと思います。要するに「場合による」ということです。

Google Search Console の `404` ページのレポートに、JSON や JavaScript のコードからと思われる URL がたくさんあります。無視すべきですか？

Gary: Reza さんからの質問です。「Google Search Console の 404 ページのレポートに、JSON や JavaScript のコードから誤って拾われたと思われる URL がたくさんあります。これは無視すべきでしょうか？」

無視してもよいですし、noindex HTTP ヘッダーを追加することもできます。

サイトマップインデックスファイルに、他のドメインのサイトマップファイルへのリンクを含められますか？

John: Dhruv さんからの質問です。「サイトマップインデックスファイルに、他のドメインのサイトマップファイルへのリンクを含められますか？」

Dhruv さん、興味深い質問です。Google からの答えは「おそらく」です。そのため、そのようなセットアップは使用しないことをおすすめします。ドメインが異なる URL のサイトマップを送信できるのは、robots.txt でサイトマップを送信するか、Search Console ですべてのドメインの所有権を確認するかのどちらかの場合です。特に、Search Console の所有権は明確ではない場合があり、ウェブサイトを分析してもすぐにはわからないため、その関連性を忘れがちです。もしサイトマップファイルを作成していて、このようなセットアップを使いたいと思った場合は、サイトマップファイルに XML コメントを追加することをおすすめします。これにより、要件を覚えておき、将来誤って要件に違反してしまわないようにできます。Search Console は Google 固有のものなので、他の検索エンジンでの要件についても確認しておきましょう。

Google がウェブサイトのメタディスクリプションを選択する可能性を減らすにはどうしたらよいでしょうか？

Gary: Sam Bowers さんからの質問です。「Google がウェブサイトのメタディスクリプションを選択する可能性を減らすにはどうしたらよいでしょうか？」

良い質問です。常にではありませんが、通常、Google のアルゴリズムは、ページにコンテンツが少ない場合や、ページの実際のコンテンツよりもメタディスクリプションの方がユーザーのクエリに関連している場合に、メタディスクリプションを使用します。詳しくは説明とスニペットをご覧ください。

検索エンジンの bot がページ上の特定のセクションをクロールしないように指定する方法はありますか？

John: 「検索エンジンの bot がページ上の特定のセクションをクロールしないように指定する（ページの該当部分以外ではクロールとインデックス登録を許可する）方法はありますか？」メガメニュー内に重複が多く、それをブロックしたいとのことです。

確かに、ページの一部のインデックスを防ぐ方法はありますが、特に一般的なページ要素（ヘッダー、メニュー、サイドバー、フッターなど）については、インデックス登録からブロックする必要はありません。検索エンジンはありのままのウェブを扱うので、巨大なメガメニューやオーバーフッターがあっても問題ありません。ページ上の他のコンテンツについては、robots.txt で許可されていないソースを含む iframe を使うか、同様に robots.txt でブロックされている JavaScript でコンテンツを取り込むことができます。スニペットで表示されるのを避けたいだけなら、data-nosnippet 属性を使うのが良い方法です。しかし繰り返しますが、メニューを隠すためだけにここまで複雑にする必要はありません。不必要に複雑にすると予期せぬ障害のリスクが生まれるので、本当に必要な場合に限定することをおすすめします。

Gary: Jeethu さんからの質問です。「ウェブページの無限スクロールは推奨されますか？無限スクロール機能を追加した場合、オーガニックトラフィックや GoogleBot に影響はありますか？」

無限スクロールをどのように実装するかによります。各ページや仮想ページが一意の URL でアクセスでき検索可能であれば、一般的には無限スクロールでも問題ないでしょう。

モバイルウェブでは表示されますが、パソコンでは非表示になるリンクがあります。Google はそのリンクの評価を下げるでしょうか？

John: Ryan さんからの質問です。「ホームページのリンクが、モバイルウェブでは表示されますが、パソコンでは JavaScript のトグルの後ろに隠れていて、クリックされない限り HTML に含まれない場合、Google はそのリンクの評価を下げるでしょうか？」

Ryan さん、モバイルファーストインデックスでは、モバイル版ページをインデックス登録とリンク発見の基準としています。モバイル版のコンテンツが完全であれば問題ありません。デスクトップ版のコンテンツの方が少ないのは意外に感じますが、何か理由があるのでしょう。

Google は、ウェブサイトにホストされていない Google ドライブに保存した PDF ファイルをインデックスに登録しますか？

Gary: 匿名の方からの質問です。「Google は、ウェブサイトにホストされていない Google ドライブに保存した PDF ファイルをインデックスに登録しますか？その場合、どのくらいの時間がかかりますか？」

はい、Google は Google ドライブにホストされている公開 PDF ファイルをインデックスに登録できます。サイトの URL の一つにすぎません。他の URL と同様に、これらの PDF のインデックス登録は数秒で完了することもあれば、いつまでも完了しないこともあります。

Google は、スクロールジャックが設定されているコンテンツをどのようにクロールしますか？また、UX に対するこのアプローチはランキングに影響を与えるでしょうか？

John: Matt さんからの質問です。「ウェブで『スクロールジャック』の人気が高まっています。一般的に、これはユーザーエクスペリエンスを悪化させるものと見なされていますが、Google はこのコンテンツをどのようにクロールしますか？また、UX に対するこのアプローチはランキングに影響を与えるでしょうか？」スクロールジャックに関する記事へのリンクも投稿されていたので、文字起こしでリンクしておきます。

Matt さん、興味深い質問です。それが「スクロールジャック」と呼ばれているとは知りませんでした。リンクもありがとうございます。Google がこの設定を不正行為とみなすとは思わないので、直接的な影響はないでしょう。しかし、技術的な二次的影響はあるかもしれません。たとえば Google は、理論上の巨大なモバイルデバイスでページを読み込むことによってページをレンダリングします。おかしなスクロールイベントによってページのコンテンツが表示されない場合、Google のシステムはコンテンツが正しく表示されていないと判断するかもしれません。要するに、これは品質的な問題というよりも、潜在的なレンダリングの問題だと思います。

Google Search Console で robots.txt によってブロックされている URL がインデックスに登録されているのはなぜですか？

Gary: Deniz Can Aral さんからの質問です。「Google Search Console で robots.txt によってブロックされているのに、インデックスに登録されているのはなぜですか？」

これは比較的よくある質問です。Google は、robots.txt によってクロールがブロックされている URL であっても、コンテンツではなく URL のみをインデックスに登録できます。ブロック済み URL がインターネット上で非常に注目されている場合にのみこのような現象が発生するため、そのような URL がインデックスに登録される例はごくわずかです。もし問題がある場合は、その URL のクロールを許可し、HTTP ヘッダーまたは <meta> タグで noindex ルールを使用してください。

不要な AI 生成コンテンツがあります。どうやって修正、またはウェブサイトから削除すればいいですか？

John: Sonia さんからの質問です。「雇ったコンテンツライターが AI 生成コンテンツを提供していました。どう修正すればいいですか？ただ AI コンテンツを削除すればいいのでしょうか？新しいコンテンツに置き換えるのでしょうか？破棄して、新しい URL で新しいウェブサイトを作成するのでしょうか？アドバイスをお願いします。」

何とも言えません。外部の著者が作成したコンテンツをレビューせず、やみくもに公開したようですね。AI 生成コンテンツという側面を抜きにしても、それは良い考えではありません。理由やソースにかかわらず、低品質なコンテンツをウェブサイトに公開してしまい、今後そのコンテンツに関連付けられたくないのであれば、コンテンツを削除または修正してください。もう少し大局的に見ることをおすすめします。このようなコンテンツがウェブ上に存在せず、自身のサイトが全体としてユーザーに大きな価値を提供することはあるでしょうか？それとも、ウェブにすでに存在するコンテンツの焼き直しでしょうか？もしあなたのコンテンツが他の人のコンテンツと本質的に同じなら、検索エンジンがそのコンテンツをインデックスに登録し、ましてや検索結果で上位に表示させる必要はありません。もちろん、優れたウェブサイトを作るには、優れた記事だけでなく、明確な戦略と全員が目標に参画できるようなプロセスが必要です。

ある日突然、インデックスに登録された URL が急増しました。何が理由でしょうか？

Gary: Lorenzo さんからの質問です。「ある日突然、インデックスに登録された URL が急増しました。何が理由でしょうか？」

ハードディスクが増設されたのか、スペースが空いたのか、あるいは、その新しい URL がちょうど発見されたのか、理由はわかりません。いずれにせよ喜ばしいことです。お祝いしましょう！

Google では 1 つのファビコンファイルで複数のファイルサイズを使用できますか？

John: Dave さんからの質問です。「Google では 1 つのファビコンファイルで複数のファイルサイズを使用できますか？sizes 属性でマークアップされた複数のアイコンを理解し、適切なアイコンを選択できますか？」

Dave さん、技術的には、.ico ファイル形式で複数の解像度のファイルを提供できます。しかし、さまざまな目的で使用されるサイズの数が増えているため、一般的にはサイズとファイルを個別に指定する方がよいでしょう。Google は HTML で複数のファビコンサイズをサポートしているので、提供したい特定のサイズがあればこちらがおすすめです。

ウェブサイトの一部が異なる CMS を利用している場合、Google は異なる評価をしますか？

Gary: Vivienne さんからの質問です。「ウェブサイトの一部が異なる CMS を利用している場合、Google は異なる評価をしますか？」

いいえ。

Google 検索で、PDF のダウンロードページがウェブサイトのメインページとして表示されます。検索結果を変更できますか？

John: Anna さんからの質問です。「私たちの財団のウェブサイトの Google 検索結果について、再クロールが必要です。PDF のダウンロードページがメインページとして表示されます。オランダの人権財団のウェブサイトです。検索結果を変更できますか？」

Anna さん、ウェブサイトを拝見しましたが、ホームページの代わりに他のページが表示されている理由は、ホームページに noindex robots <meta> タグがあるためです。この <meta> タグはページのインデックス登録を妨げます。このタグを削除すればすぐに解決するはずです。

Google 検索で私のウェブサイトを検索すると、最初の結果がスタートページではなく製品ページになっています。なぜでしょうか？

John: Julien さんからの質問です。「Google 検索で私のウェブサイトを検索すると、最初の結果がスタートページではなく製品ページになっています。なぜでしょうか？製品ページは SEO 対策をしていませんが、スタートページは SEO 対策をしています。」

Julien さん、Google は特定のクエリについて、どのページがユーザーにとって最も関連性が高いかを把握するために、さまざまな要素を使用しています。情報検索において、そのコンセプトのひとつは認識されたユーザーインテントに基づいています。つまり、ユーザーはこの検索を行ったとき何をしようとしていたのか、ということです。ある製品や会社についての詳細情報を探しているのでしょうか？それとも、今すぐその製品を買おうとしているのでしょうか？これは、同じクエリでも時間の経過とともに変化する可能性もあります。つまり、SEO 対策をしていないページでも、システムがその時点で関連性があると判断すれば、検索に表示される可能性があるということです。実践としては、ユーザーがどこにアクセスしても良いエクスペリエンスを提供できるように、自サイトへのアクセスのパターンを把握し、ユーザーのニーズを適切に満たせるようにすることをおすすめします。

INP の問題の改善に関する Search Console のアラートを受け取りました。このデータはどのように計算されていますか？また、最も簡単な修正方法は何ですか？

John: Alejandro さんからの質問です。「John さん、Google チームの皆さん、こんにちは。今日、INP の問題の改善に関する Search Console のアラートを受け取りました。このデータはどのように計算されていますか？また、それを修正する最も簡単な方法は何ですか？」

ここでは十分に回答できませんが、web.dev のサイトに Interaction to Next Paint（INP）に関するドキュメントが豊富にあります。サイトのスコアアップに興味がある場合は、ぜひチェックしてみてください。INP はまだ Core Web Vitals には含まれておらず、Core Web Vitals はページエクスペリエンスやヘルプフルコンテンツシステムに役立つ多くのものの一つに過ぎません。INP を改善するとユーザーエクスペリエンスは確実に向上しますが、検索ランキングへの顕著な影響は期待できません。

日本語キーワードによるハッキングで生成された 3 万個の URL を Google Search Console から削除する方法を教えてください。

John: Heather さんからの質問です。「日本語キーワードによるハッキングで生成された 3 万個の URL を Google Search Console から削除する方法を教えてください。」

Heather さん、ハッキングされたとのこと、お気の毒です。すでに解決しているとよいのですが、web.dev にこの種のハッキングに関するコンテンツがあるので、文字起こしでリンクを掲載します。このハッキングは、ハッキングしたコンテンツを Google に対してクローキングする傾向があるため、完全に削除されているかダブルチェックするにはサポートが必要かもしれません。検索結果に関しては、ページ数が多いため、目につきやすいページに焦点を当て、それらを削除、またはインデックスに再登録して手動で解決し、残りは自然に取り除かれるのを待つことをおすすめします。ハッキングされたコンテンツを探そうとすれば、まだしばらくは見つかると思いますが、一般的なユーザーが探すのはサイトのはずですから、検索結果を問題ないものにすることを目標にすべきです。

Search Console でインデックス登録のためにページを送信した後、ページのインデックスが削除されるのはなぜですか？もう何度もやっています。

John: Grace さんからの質問です。「Search Console でインデックス登録のためにページを送信した後、ページのインデックスが削除されるのはなぜですか？もう何度もやっています。」

Grace さん、関係するページがわからないことには何とも言えませんが、Google のシステムがあなたのサイトとそのコンテンツの価値を認めていないようです。Google がウェブサイトのすべてのページをインデックスに登録することはほぼないので、それも想定されることです。一度はインデックスに登録させることができるかもしれませんが、後から Google のシステムがコンテンツとウェブサイトを再評価し、そのページを再び削除する可能性があります。最善の方法は、ページを送信し続けることではなく、ウェブサイトの全体的な品質、ウェブに付加している独自の価値、そしてユーザーが実際に探しているものとの一致について、Google のシステムに認められるようにすることです。そうすれば、Google が自ずからインデックスに登録します。