多地域、多言語のサイトの管理
言語、国、地域によって異なるコンテンツをユーザーに提供しているサイトの場合、Google 検索結果を最適化できます。
多言語と多地域の違い
- 多言語のウェブサイトとは、複数の言語でコンテンツを提供しているウェブサイトです。たとえば、カナダの企業のサイトに、英語版とフランス語版を設ける場合です。 Google 検索は、検索ユーザーの言語と一致するページを探します。
- 多地域のウェブサイトとは、異なる複数の国のユーザーを明示的にターゲットにしているウェブサイトです。たとえば、カナダと米国の両方に製品を発送するメーカーの場合です。 Google 検索は、検索ユーザーにとって適切な地域のページを探します。
サイトの中には、多地域でかつ多言語のサイトもあります(たとえば、米国版とカナダ版があり、カナダ版のコンテンツにフランス語版と英語版があるサイトがこれに該当します)。
多言語サイトを管理する
サイトで同一のコンテンツが複数の言語によって提供されている場合、ユーザー(と Google 検索)が適切なページを見つけられるようにするためのおすすめの方法をここで紹介します。
言語のバージョンごとに異なる URL を使用する
Google では、ページの各言語のバージョンに異なる URL を使用することをおすすめします。Cookie やブラウザの設定を使用してページ上のコンテンツの言語を調整する方法はおすすめしません。
言語ごとに異なる URL を使用する場合は、hreflang
アノテーションを使用して、Google 検索結果がページの適切な言語のバージョンにリンクできるようにします。
ユーザーの言語設定に応じて、動的にコンテンツを変更する方法や、ユーザーをリダイレクトする方法を採用する場合は、コンテンツのすべてのパターンを Google が見つけてクロールするとは限らないことにご注意ください。これは、Googlebot のクローラが通常は米国から起動されるためです。さらに、クローラが送信する HTTP リクエストのヘッダーには、Accept-Language
は設定されません。
複数の言語のバージョンがあることを Google に知らせる
言語や対象地域が異なるページのバージョンにラベルを付けて Google に知らせる方法は複数あります(hreflang
アノテーション、サイトマップなど)。ページに適宜マークを付けてください。
ページの言語が明確にわかるようにする
Google では、ページの表示内容からその言語を判断します。lang
属性のようなコードレベルの言語情報や、URL は使用しません。Google が言語を正しく判断できるように、各ページのコンテンツとナビゲーションには 1 つの言語を使用し、原文と訳文を一緒に表示することは避けてください。
ページの定型文のみが翻訳されて、コンテンツの大部分が 1 つの言語のままになっていると(ユーザー作成コンテンツが含まれるページでよく見られます)、同じコンテンツが何度も、それぞれ異なる言語の定型文とともに検索結果として表示されるため、ユーザーにとっては不便です。
robots.txt を使用して、自動翻訳したサイトページが検索エンジンからクロールされないようにしてください。自動翻訳は意味が通じない場合があるため、スパムとみなされる可能性があります。さらに重要なこととして、読みにくく不自然な翻訳はサイトのイメージ低下につながるおそれがあります。
ページの言語をユーザーが切り替えられるようにする
ページに複数のバージョンがある場合:
- サイトのある言語バージョンから別の言語バージョンにユーザーを自動的にリダイレクトすることは避けてください。たとえば、ユーザーの使用言語の推測に基づいてリダイレクトしないでください。このようなリダイレクトを行うと、ユーザー(および検索エンジン)がサイトのすべての言語バージョンを見られなくなる場合があります。
- 他の言語のバージョンへのハイパーリンクを追加することを検討してください。それにより、ユーザーがクリックするだけで、そのページの別言語のバージョンを選択できるようになります。
言語ごとの URL を使用する
URL にローカライズした単語を使用したり、国際化ドメイン名(IDN)を使用したりしてもかまいません。ただし、必ず URL には UTF-8 エンコードを使用し(これ以外のケースでも、可能な場合は常に UTF-8 を使用することをおすすめします)、リンクする際には URL を適切にエスケープするようにしてください。
特定の国をサイト コンテンツのターゲットに設定する(地域ターゲティング)
特定の言語を話す特定の国のユーザーを、ウェブサイトやその一部のターゲットに設定できます。これにより、対象国でのページ ランキングは向上しますが、他の地域や言語の結果に悪影響がおよぶことがあります。
Google でサイトの地域ターゲティングを設定するには
- ページまたはサイトのレベル: サイトまたはページに地域や言語ごとの URL を使用します。
- ページレベル:
hreflang
またはサイトマップを使用して、どのページをどの地域または言語に適用するかを Google に伝えます。
地域ターゲティングが常に正しいとは限らないため、ユーザーにサイトの「間違った」バージョンが表示された場合を考慮することが重要です。地域や言語を選択できるリンクをすべてのページに表示しておくことも一つの方法です。
地域ごとの URL を使用する
サイトまたはその一部に対して、異なる地域を簡単にターゲティングできる URL 構造を使用するようにしてください。URL 構造の選択肢を次の表に示します。
URL 構造のオプション | |||
---|---|---|---|
国別のドメイン
|
|
||
gTLD を使用するサブドメイン
|
|
||
gTLD を使用するサブディレクトリ
|
|
||
URL パラメータ
|
|
Google による対象地域の認識方法
Google は以下のさまざまな情報に基づいて、ページにとって最良なターゲット ユーザーを判断します。
- 国別コード トップレベル ドメイン名(ccTLD): これらのドメイン名は特定の国に結び付けられているため(例: .de はドイツ、.cn は中国)、ユーザーと検索エンジンは、サイトが特定の国をターゲットにしていることをすぐに認識できます。国によっては制限があり、誰でも ccTLD を使用できるとは限らないため、ご注意ください。また、Google はバニティ ccTLD(例: .tv、.me)を gTLD として扱います。このようなドメインは、特定の国をターゲットとするものではなく「ジェネリック」と見なすユーザーやウェブサイトの所有者が多いためです。Google の gTLD の一覧をご覧ください。
-
タグ、ヘッダー、サイトマップのいずれかに指定されている
hreflang
ステートメント。 - サーバーの場所(サーバーの IP アドレスを使用): サーバーは物理的にユーザーの近くにあることが多いため、サーバーの場所はサイトのターゲット ユーザーを判断する手がかりとなります。一部のウェブサイトでは、分散コンテンツ配信ネットワーク(CDN)を使用している場合やウェブサーバー インフラの充実した国でホストされている場合があるため、サーバーの場所は信頼性の高い手がかりにはなりません。
- その他の情報: サイトのターゲット ユーザーを判断するその他の手がかりには、ページに記載されている住所や電話番号、使用されている言語や通貨、他のローカルサイトからのリンク、ビジネス プロフィール(利用できる場合)などがあります。
Google が行わないこと:
- Google は世界中のさまざまな場所からウェブをクロールします。しかし、ページの別のパターンがあるかどうかを探すために、1 つのサイトに使用されているクローラソースを変えることはありません。そのため、サイトで公開している地域や言語ごとのバージョンは、
hreflang
エントリ、国別コード トップレベル ドメイン、明示的なリンクなどの方法を使用して Google に明示的に示すようにしてください。 - Google は場所の
meta
タグ(geo.position
、distribution
など)や、地域ターゲティングの HTML 属性は無視します。
多言語、多地域のサイトでの重複ページを処理する
多地域のサイトの一部で、同言語の類似コンテンツまたは重複コンテンツを異なる URL で提供する場合(例: example.de/
と example.com/de/
の両方でドイツ語の類似したコンテンツを表示する)は、優先するバージョンを選択し、rel="canonical"
要素と hreflang
タグを使用して、検索ユーザーに適切な言語または地域の URL が表示されるようにします。
ジェネリック トップレベル ドメイン
ジェネリック トップレベル ドメイン(gTLD)は、特定の地域に関連付けられていないドメインです。ジェネリック トップレベル ドメイン(.com や .org など下記に示すドメイン)を持つサイトで特定の地域のユーザーをターゲットに設定する場合は、上記のいずれかの方法でターゲットにする国を明示的に設定します。
Google は次のトップレベル ドメインを gTLD として扱います。
-
ジェネリック トップレベル ドメイン(gTLD): トップレベル ドメインが ICANN で国別コード トップレベル ドメイン(ccTLD)として登録されている場合を除き、Google は IANA DNS ルートゾーンで名前が解決する TLD を gTLD として扱います。例:
- .com
- .org
- .edu
- .gov
- ...他多数
- ジェネリック地域トップレベル ドメイン: 以下のドメインは地域に関連付けられていますが、通常はジェネリック トップレベル ドメインとして、つまり .com や .org と同様に扱われます。
- .eu
- .asia
-
ジェネリック国別コード トップレベル ドメイン(ccTLD): Google は一部の ccTLD(.tv、.me など)を gTLD として扱います。このようなドメインは特定の国をターゲットとするものではなく「ジェネリック」と見なすユーザーやウェブサイトの所有者が多いためです。このような ccTLD の一覧は以下のとおりです(この一覧は変更される可能性があります)。
- .ad
- .ai
- .as
- .bz
- .cc
- .cd
- .co
- .dj
- .fm
- .io
- .la
- .me
- .ms
- .nu
- .sc
- .sr
- .su
- .tv
- .tk
- .ws