Gérer l'exploration des URL de navigation à facettes
La navigation à facettes est une fonctionnalité courante des sites Web qui permet aux visiteurs de modifier la façon dont les éléments (produits, articles ou événements, par exemple) sont affichés sur une page. Il s'agit d'une fonctionnalité populaire et utile. Toutefois, son implémentation la plus courante, basée sur les paramètres d'URL, peut générer des espaces d'URL infinis qui nuisent au site Web de plusieurs façons:
- Surexploration: les URL créées pour la navigation à facettes semblent être nouvelles et les robots d'exploration ne peuvent pas déterminer si elles seront utiles sans les explorer au préalable. Par conséquent, les robots d'exploration accèdent généralement à un très grand nombre d'URL de navigation à facettes avant que leurs processus déterminent que les URL sont en fait inutiles.
- Exploration plus lente: il découle de ce qui précède que, si les robots d'exploration explorent des URL inutiles, ils ont moins de temps à consacrer aux nouvelles URL utiles.
Une URL de navigation à facettes typique peut contenir différents paramètres dans la chaîne de requête, liés aux propriétés des éléments filtrés. Exemple :
https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny
Si vous modifiez l'un des paramètres d'URL products
, color
et size
, un autre ensemble d'éléments s'affiche sur la page sous-jacente. Cela implique souvent un très grand nombre de combinaisons de filtres possibles, ce qui se traduit par un très grand nombre d'URL possibles. Pour économiser vos ressources, nous vous recommandons de gérer ces URL de l'une des manières suivantes:
- Si vous n'avez pas besoin que les URL de navigation à facettes soient potentiellement indexées, empêchez en l'exploration.
- Si vous souhaitez qu'elles soient potentiellement indexées, assurez-vous qu'elles respectent les bonnes pratiques décrites dans la section suivante. N'oubliez pas que l'exploration des URL à facettes a tendance à coûter aux sites de grandes quantités de ressources de calcul en raison du nombre considérable d'URL et d'opérations nécessaires pour afficher ces pages.
Empêcher l'exploration des URL de navigation à facettes
Si vous souhaitez économiser des ressources de serveur et que vous n'avez pas besoin que vos URL de navigation à facettes apparaissent dans la recherche Google, vous pouvez empêcher l'exploration de ces URL de l'une des manières suivantes.
-
Utilisez le fichier robots.txt pour interdire l'exploration des URL de navigation à facettes. Souvent, il n'y a aucune raison valable de permettre l'exploration des éléments filtrés, car cela consomme des ressources du serveur sans aucun avantage ou avec un avantage négligeable. Autorisez plutôt l'exploration des pages des éléments individuels, ainsi que d'une page de liste dédiée qui affiche tous les produits sans filtres appliqués.
user-agent: Googlebot disallow: /*?*products= disallow: /*?*color= disallow: /*?*size= allow: /*?products=all$
-
Utilisez des fragments d'URL pour spécifier des filtres.
En général, la recherche Google n'accepte pas les fragments d'URL lors de l'exploration et de l'indexation.
Si votre mécanisme de filtrage est basé sur les fragments d'URL, il n'aura aucun impact (positif ou négatif) sur l'exploration. Par exemple, au lieu d'utiliser des paramètres d'URL, utilisez des fragments d'URL:
https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny
Vous pouvez également indiquer les URL de navigation à facettes à explorer (ou non) à l'aide de l'élément rel="canonical"
link
et de l'attribut d'ancrage rel="nofollow"
. Toutefois, ces méthodes sont généralement moins efficaces à long terme que les méthodes mentionnées précédemment.
-
L'utilisation de
rel="canonical"
pour spécifier la version canonique d'une URL de navigation à facettes peut, à terme, réduire le volume d'exploration des versions non canoniques de ces URL. Par exemple, si vous disposez de trois types de pages filtrées, envisagez de redirigerrel="canonical"
vers la version non filtrée :https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny
spécifie<link rel="canonical" href="https://example.com/items.shtm?products=fish" >
. -
Il peut être utile d'utiliser des attributs
rel="nofollow"
sur les points d'ancrage redirigeant vers des pages de résultats filtrés. Toutefois, n'oubliez pas que chaque point d'ancrage redirigeant vers une URL spécifique doit comporter l'attributrel="nofollow"
pour fonctionner.
Assurez-vous que les URL de navigation à facettes sont optimales pour le Web
Si vous souhaitez que vos URL de navigation à facettes soient potentiellement explorées et indexées, assurez-vous de suivre ces bonnes pratiques pour minimiser les effets négatifs de l'exploration du grand nombre d'URL potentielles sur votre site:
-
Utilisez le séparateur de paramètres d'URL standard du secteur,
&
. Les robots d'exploration ont du mal à détecter des caractères comme la virgule (,
), le point-virgule (;
) et les crochets ([
et]
) en tant que séparateurs de paramètres (car le plus souvent ils ne sont pas utilisés comme séparateurs). -
Si vous encodez des filtres dans le chemin d'URL, par exemple
/products/fish/green/tiny
, assurez-vous que leur ordre logique reste toujours le même et qu'aucun filtre en double ne peut exister. -
Renvoyez un code d'état HTTP
404
lorsqu'une combinaison de filtres ne renvoie pas de résultats. S'il n'y a pas de poisson vert dans l'inventaire du site, les utilisateurs et les robots doivent recevoir une erreur "Introuvable" avec le code d'état HTTP approprié (404
). Il en va de même si l'URL contient des filtres en double ou des combinaisons de filtres non pertinentes, et des URL de pagination inexistantes. De même, si une combinaison de filtres ne renvoie aucun résultat, ne redirigez pas l'utilisateur vers une page d'erreur "Introuvable" standard. Au lieu de cela, affichez une erreur "Introuvable" avec le code d'état HTTP404
sous l'URL où elle a été rencontrée.