Gérer les sites multirégionaux et multilingues

Vous avez la possibilité d'optimiser les résultats de la recherche Google pour votre site si celui-ci propose un contenu différent aux internautes en fonction de leur langue, de leur pays ou de leur région.

Contexte :

  • Un site Web multilingue est un site dont le contenu est proposé dans plusieurs langues, par exemple, en anglais et en français, pour une entreprise canadienne. La recherche Google essaie alors de trouver les pages correspondant à la langue de l'internaute.
  • Un site Web multirégional est un site qui cible explicitement les internautes de différents pays. Par exemple, un fabricant peut utiliser un site multilingue pour faire la promotion de ses produits au Canada et aux États-Unis. Dans ce cas, la recherche Google essaie de trouver la page correspondant aux paramètres régionaux de l'internaute.

Certains sites sont à la fois multilingues et multirégionaux. Par exemple, un site peut proposer une version pour les États-Unis et une autre pour le Canada, et être disponible en français et en anglais dans la version canadienne.

Gérer les différentes versions d'un site multilingue

Si le contenu de votre site est publié dans plusieurs langues, voici quelques conseils que vous pouvez suivre pour aider les internautes (et la recherche Google) à trouver la bonne page :

Utiliser des URL distinctes pour chaque version linguistique

Au lieu d'utiliser des cookies ou les paramètres de navigateur pour ajuster la langue dans laquelle s'affiche la page, nous recommandons de définir des URL distinctes pour chacune de ses versions linguistiques.

Si vous définissez des URL différentes pour chaque langue, utilisez des annotations hreflang afin que les résultats de la recherche Google renvoient vers la bonne version linguistique d'une page.

Si vous préférez modifier le contenu de manière dynamique ou rediriger l'utilisateur en fonction de ses paramètres linguistiques, sachez que toutes vos variantes ne seront peut-être pas explorées par Google. Cela est dû au fait que le robot d'exploration Googlebot opère généralement depuis les États-Unis. De plus, l'en-tête des requêtes HTTP qu'il envoie ne contient pas l'attribut Accept-Language.

Signaler les différentes versions linguistiques à Google

Google accepte différentes méthodes de signalement des variantes linguistiques ou régionales d'une page, par exemple les annotations hreflang et les sitemaps. Il est important de baliser vos pages de manière appropriée.

Vérifier que la langue de la page est facilement identifiable

Nous utilisons le contenu visible de votre page pour déterminer sa langue. Nous ne tenons pas compte de l'URL ni des informations linguistiques codées telles que les attributs lang. Vous pouvez aider Google à déterminer la langue correcte en vous limitant à une langue par page (pour le contenu et les éléments de navigation) et en évitant les traductions côte à côte.

Si vous ne traduisez que le texte réutilisable de vos pages et si vous laissez la majeure partie de votre contenu dans une seule langue (ce qui arrive souvent sur les pages avec du contenu généré par l'utilisateur), vous pouvez créer une expérience utilisateur de mauvaise qualité. En effet, un même contenu pourra s'afficher plusieurs fois dans les résultats de recherche avec du texte réutilisable en différentes langues.

Utilisez un fichier robots.txt pour empêcher les moteurs de recherche d'explorer les pages de votre site traduites automatiquement. Les traductions automatiques ne sont pas toujours pertinentes et peuvent être considérées comme du spam. En outre, une traduction mal faite ou trop littérale peut nuire à l'image de votre site.

Permettre aux internautes de changer la langue de la page

Si vous proposez plusieurs versions d'une page :

  • Envisagez d'ajouter des liens hypertexte vers les autres versions linguistiques de cette page. De cette façon, les internautes peuvent choisir d'accéder à la version linguistique qui les intéresse le plus.
  • Évitez les redirections automatiques basées sur la détection de la langue de l'utilisateur. En effet, celles-ci risquent d'empêcher les internautes (et les moteurs de recherche) de consulter toutes les versions de votre site.

Utiliser des URL spécifiques à la langue

L'utilisation de termes localisés dans l'URL ou d'un nom de domaine internationalisé (IDN) est acceptée. Toutefois, veillez à utiliser l'encodage UTF-8 dans les URL chaque fois que cela est possible. Pensez également à ajouter des caractères d'échappement dans vos liens.

Cibler le contenu d'un site pour un pays spécifique (ciblage géographique)

Vous pouvez cibler tout ou partie de votre site Web pour les internautes situés dans un pays spécifique et parlant une langue donnée. Bien que cette approche puisse améliorer le classement de votre page dans le pays cible, sachez qu'elle peut également nuire à votre position dans les résultats de recherche pour les autres langues ou paramètres régionaux.

Pour configurer le ciblage géographique de votre site sur Google, procédez comme suit :

Notez que le ciblage géographique n'est pas une science exacte. Il est donc important d'envisager le cas de figure des internautes qui arrivent sur la "mauvaise" version de votre site. Pour remédier à ce problème, vous pouvez, par exemple, ajouter des liens sur toutes vos pages afin de permettre aux visiteurs de sélectionner la langue ou la région de leur choix.

Utiliser des URL spécifiques aux paramètres régionaux

Envisagez d'utiliser une structure d'URL facilitant le ciblage géographique de tout ou partie de votre site en fonction de différentes régions. Consultez le tableau ci-dessous pour découvrir les options dont vous disposez :

Structures d'URL possibles
Domaine spécifique au pays

example.de

Avantages :

  • Ciblage géographique clair
  • Localisation géographique du serveur non pertinente
  • Séparation aisée des sites

Inconvénients :

  • Onéreux (la disponibilité peut être limitée)
  • Nécessite une infrastructure plus importante
  • Exigences strictes liées au domaine national de premier niveau
Sous-domaines avec un domaine de premier niveau générique

de.example.com

Avantages :

  • Facilité de la mise en œuvre
  • Possibilité d'utiliser le ciblage géographique de la Search Console
  • Plusieurs localisations géographiques possibles pour le serveur
  • Séparation aisée des sites

Inconvénients :

  • Ne facilite pas l'identification du ciblage géographique à l'aide de l'URL seule (le code "de" correspond-il à la langue ou au pays ?)
Sous-répertoires avec un domaine de premier niveau générique

example.com/de/

Avantages :

  • Facilité de la mise en œuvre
  • Possibilité d'utiliser le ciblage géographique de la Search Console
  • Peu de maintenance (même hébergeur)

Inconvénients :

  • Ne facilite pas l'identification du ciblage géographique à l'aide de l'URL seule
  • Localisation géographique du serveur unique
  • Séparation des sites plus complexe
Paramètres d'URL

site.com?loc=de

Utilisation déconseillée

Inconvénients :

  • Segmentation de l'URL compliquée
  • Ne facilite pas l'identification du ciblage géographique à l'aide de l'URL seule
  • Utilisation impossible du ciblage géographique dans la Search Console

Comment les paramètres régionaux cibles sont-ils déterminés par Google ?

Google s'appuie sur plusieurs signaux pour déterminer l'audience cible la plus appropriée pour une page :

  • Paramètres régionaux cibles spécifiés à l'aide du rapport Ciblage international de la Search Console. Si vous utilisez un domaine de premier niveau générique (gTLD) et que vous faites appel à un fournisseur d'hébergement situé dans un autre pays, nous vous conseillons d'utiliser la Search Console afin de nous signaler le pays auquel votre site doit être associé (dans la mesure où vous souhaitez activer le ciblage géographique).
  • Noms de domaines nationaux de premier niveau (ccTLD). Ces noms de domaine sont associés à un pays spécifique (par exemple, .de pour l'Allemagne, .cn pour la Chine) et indiquent donc aux internautes ainsi qu'aux moteurs de recherche que votre site est destiné à tel ou tel pays. Certains pays ne permettent pas d'utiliser librement les noms de domaines nationaux de premier niveau. Veillez à vous renseigner au préalable. Nous traitons également certains domaines nationaux de premier niveau (tels que .tv et .me) comme des domaines de premier niveau génériques, car nous avons constaté que les internautes et les propriétaires de sites Web considèrent souvent ces noms de domaines comme étant davantage génériques que relatifs à un pays précis. Nous ne fournissons pas la liste des domaines nationaux de premier niveau traités comme des domaines de premier niveau génériques, car celle-ci ne cesse d'évoluer. Consultez la liste des domaines de premier niveau génériques de Google.
  • Instructions hreflang, que ce soit dans les balises, les en-têtes ou les sitemaps.
  • Localisation du serveur par le biais de son adresse IP. Le serveur d'un site est souvent situé à proximité de ses visiteurs, ce qui peut fournir une indication quant à l'audience ciblée. Certains sites Web font appel à des réseaux de diffusion de contenu ou sont hébergés dans un pays qui dispose d'une infrastructure de serveur Web de meilleure qualité. Par conséquent, ne vous fiez pas uniquement à la localisation géographique du serveur.
  • Autres signaux. Des adresses et des numéros de téléphone locaux, une langue et une devise locales, des liens vers d'autres sites locaux et/ou l'utilisation de Google My Business (si le service est disponible) sont d'autres indices qui renseignent sur l'audience cible de votre site.

Ce que Google ne fait pas :

  • Google explore le Web à partir de différents endroits dans le monde. Nous n'essayons pas de faire varier la source du robot d'exploration utilisée pour un seul site afin de trouver toutes les variantes possibles d'une page. Par conséquent, veillez à bien indiquer à Google toute variante linguistique ou régionale de votre site via l'une des méthodes présentées ici (telles que les entrées hreflang, les noms de domaines nationaux de premier niveau ou les liens explicites).
  • Google ignore les balises Meta de localisation (telles que geo.position ou distribution) ou les attributs HTML de ciblage géographique.

Gérer les pages en double avec les sites multilingues/multirégionaux

Si vous proposez un contenu similaire ou en double pour la même langue d'un site multirégional sur des URL différentes (par exemple, si example.de/ et example.com/de/ présentent un contenu similaire en allemand), vous devez choisir votre version préférée et utiliser les balises rel="canonical" elementet hreflang pour vous assurer que les internautes accèdent à l'URL linguistique ou régionale appropriée.

Domaines de premier niveau génériques

Les domaines de premier niveau génériques (gTLD) sont des domaines qui ne sont pas associés à des zones géographiques spécifiques. Si votre site utilise un domaine de premier niveau générique tel que .com, .org ou tout autre domaine mentionné ci-dessous, et si vous souhaitez cibler les internautes d'une zone géographique précise, nous vous conseillons de définir explicitement un pays cible via l'une des méthodes décrites précédemment.

Nous traitons les domaines suivants comme des domaines de premier niveau génériques qui peuvent faire l'objet d'un ciblage géographique dans la Search Console :

  • Domaines de premier niveau génériques (gTLD) : sauf si un domaine de premier niveau est enregistré en tant que domaine national de premier niveau (ccTLD) auprès de l'ICANN, nous traitons tout domaine de premier niveau qui passe par la zone racine DNS gérée par l'IANA comme un domaine de premier niveau générique. Vous trouverez quelques exemples ci-dessous.
    • .com
    • .org
    • .edu
    • .gov
    • etc.
  • Domaines régionaux de premier niveau génériques : bien que ces domaines soient associés à une région, ils sont généralement considérés comme des domaines de premier niveau génériques (tout comme les domaines .com ou .org) :
    • .eu
    • .asia
  • Domaines nationaux de premier niveau génériques (ccTLD) : Google traite certains domaines nationaux de premier niveau (tels que .tv et .me) comme des domaines de premier niveau génériques, car nous avons constaté que les internautes et les propriétaires de sites Web considèrent souvent ces noms de domaines comme étant davantage génériques que relatifs à un pays précis. Voici une liste de ces domaines nationaux de premier niveau (sujette à modification).
    • .ad
    • .as
    • .bz
    • .cc
    • .cd
    • .co
    • .dj
    • .fm
    • .io
    • .la
    • .me
    • .ms
    • .nu
    • .sc
    • .sr
    • .su
    • .tv
    • .tk
    • .ws