Lundi 02 mai 2011
Plongé dans votre routine, vous utilisez les outils pour les webmasters afin de vérifier l'état de votre super site quand soudain… Vous découvrez que la page Erreurs d'exploration est pleine d'erreurs 404 (Not found)
!
Une catastrophe est-elle imminente ?
Pas de panique, jeune Padawan ! Examinons les erreurs 404
et leur impact (ou non) sur votre site :
Q : Les erreurs 404
signalées dans les outils pour les webmasters affectent-elles le classement de mon site ?
R : Les erreurs 404
sont parfaitement normales sur le Web. Internet est en évolution constante, de nouveaux contenus naissent, les anciens contenus meurent et renvoient (dans l'idéal) un code de réponse HTTP 404
. Ce fonctionnement est connu des moteurs de recherche. Nous avons des erreurs 404
sur nos propres sites, comme vous pouvez le voir ci-dessus, et on en trouve sur tout le Web. En fait, nous préférons que lorsque vous supprimez une page de votre site, vous vous assuriez qu'elle renvoie un code de réponse 404
ou 410
correct (au lieu d'un "soft
404
"). N'oubliez pas que, pour que notre robot d'exploration puisse voir le code de réponse HTTP d'une URL, il doit être en mesure d'explorer cette URL. En effet, si elle est bloquée par votre fichier robots.txt, nous ne serons pas en mesure de le faire ni de voir le code de réponse. Le fait que certaines URL de votre site n'existent plus ou renvoient des erreurs 404
n'a aucune incidence sur les performances des autres URL de votre site (celles qui renvoient le code d'état 200 (Success)
) dans nos résultats de recherche.
Q : Les erreurs 404
n'ont donc aucun impact sur mon site Web ?
R : L'affichage d'une erreur 404
en elle-même sur certaines URL de votre site n'est pas préjudiciable et ne vous est pas défavorable dans les résultats de recherche Google. Toutefois, d'autres raisons peuvent vous inciter à corriger certains types d'erreurs 404
. Par exemple, si certaines des pages 404
sont des pages qui vous intéressent vraiment, cherchez pourquoi des erreurs 404
s'affichent lors de leur exploration. Si vous remarquez une URL légitime mal orthographiée (www.example.com/genal au lieu de www.example.com/genial), il est probable qu'un internaute ait volontairement créé un lien vers votre site et ait fait une faute de frappe. Au lieu de renvoyer une erreur 404
, vous pouvez rediriger avec le code 301
l'URL mal orthographiée vers la bonne URL et capturer le trafic prévu à partir de ce lien. Vous pouvez aussi aider les utilisateurs qui arrivent sur une page 404
de votre site à trouver ce qu'ils cherchaient plutôt que simplement afficher "404
introuvable".
Q : Pouvez-vous m'en dire plus sur les erreurs soft 404
?
R : Une erreur soft 404
correspond à un serveur Web qui renvoie un code de réponse autre que 404
(ou 410
) pour une URL qui n'existe pas. C'est par exemple le cas lorsqu'un propriétaire de site souhaite renvoyer une jolie page 404
avec des informations utiles aux internautes et pense que, pour leur diffuser le contenu, il doit renvoyer le code de réponse 200
. Ce n'est pas le cas. Vous pouvez renvoyer un code de réponse 404
tout en diffusant le contenu de votre choix. Autre exemple : lorsqu'un site redirige des URL inconnues vers sa page d'accueil au lieu de renvoyer des erreurs 404
. Ces deux cas de figure peuvent avoir des effets négatifs sur la compréhension et l'indexation de votre site. Par conséquent, nous vous recommandons de vous assurer que votre serveur renvoie les codes de réponse appropriés pour les contenus inexistants. Gardez à l'esprit que simplement parce qu'une page indique "404
– Introuvable", cela ne signifie pas qu'elle renvoie un code de réponse HTTP 404
. Pour le savoir, utilisez la fonctionnalité Explorer comme Googlebot dans les outils pour les webmasters. Si vous ne savez pas comment configurer votre serveur pour qu'il renvoie les codes de réponse appropriés, consultez la documentation d'aide de votre hébergeur Web.
Q : Comment savoir si une URL doit renvoyer un code 404
, 301
ou 410
?
R : Lorsque vous supprimez une page de votre site, demandez-vous si le contenu est déplacé ailleurs ou si vous ne souhaitez plus avoir ce type de contenu sur votre site. Si vous déplacez ce contenu vers une nouvelle URL, vous devez rediriger avec un code 301
l'ancienne URL vers la nouvelle. Ainsi, lorsque les internautes accèdent à l'ancienne URL pour en trouver le contenu, ils sont automatiquement redirigés vers une page pertinente par rapport à leur recherche. Si vous souhaitez supprimer complètement le contenu en question et qu'aucun autre contenu de votre site n'est destiné à le remplacer, l'ancienne URL doit alors renvoyer un code d'état 404
ou 410
. Actuellement, Google traite le code 410 (Gone)
de la même manière que le code 404 (Not found)
. Il n'est donc pas important que vous nous renvoyiez l'un ou l'autre.
Q : La plupart de mes erreurs 404
concernent des URL anormales qui n'ont jamais existées sur mon site.
Pouvez-vous m'en dire plus ? D'où viennent-elles ?
R : Si Google détecte un lien sur le Web qui renvoie vers une URL de votre domaine, il peut tenter d'explorer ce lien, qu'il existe ou non un contenu. Le cas échéant, votre serveur devrait renvoyer un code 404
s'il n'y a rien à trouver. Ces liens peuvent être dus à une faute d'orthographe commise par une personne qui renvoie vers votre site, à une erreur de configuration (si les liens sont générés automatiquement, par exemple par un CMS) ou à une amélioration de Google dans le domaine de la détection et de l'exploration de liens intégrés dans JavaScript ou d'autres contenus intégrés. Il peut également s'agir d'une vérification rapide de notre part visant à déterminer comment votre serveur gère les URL inconnues, pour n'en nommer que quelques-unes. Si vous voyez des erreurs 404
signalées dans les outils pour les webmasters pour des URL qui n'existent pas sur votre site, vous pouvez les ignorer sans problème. Nous ne savons pas quelles URL sont importantes pour vous, et inversement, et lesquelles sont censées retourner un code 404
. Nous vous montrons donc toutes les erreurs 404
que nous avons détectées sur votre site, et nous vous laissons choisir celles qui nécessitent votre attention, le cas échéant.
Q : Un utilisateur a effectué du scrapping sur mon site et a généré de nombreuses erreurs 404
. Il s'agit toutes de "vraies" URL avec du code collé dedans, comme https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>
. Est-ce que cela nuit à mon site ?
R : En général, vous n'avez pas à vous soucier que des "liens non fonctionnels" comme celui-ci nuisent à votre site. Nous sommes conscients que les propriétaires de sites disposent d'un contrôle limité, voire inexistant, sur les internautes qui effectuent du scraping sur leur site ou qui redirigent vers ce site de façon inhabituelle. Si vous maîtrisez l'expression régulière, vous pouvez envisager de rediriger ces URL. Cependant, il n'est généralement pas nécessaire de s'en soucier. N'oubliez pas que vous pouvez également envoyer une demande de retrait si vous pensez qu'un utilisateur vole du contenu original sur votre site Web.
Q : La semaine dernière, j'ai corrigé toutes les erreurs 404
signalées par les outils pour les webmasters, mais elles apparaissent toujours dans mon compte. Cela signifie-t-il que je ne les ai pas bien corrigées ? Combien de temps faut-il pour qu'elles disparaissent ?
R : Consultez la colonne "Détectée" sur la page "Erreurs d'exploration". Il s'agit de la date la plus récente à laquelle nous avons détecté chaque erreur. Si la ou les dates indiquées dans cette colonne sont antérieures à la date à laquelle vous avez corrigé les erreurs, cela signifie que nous n'avons pas rencontré ces erreurs depuis cette date. Si les dates sont plus récentes, cela signifie que ces erreurs 404
continuent de s'afficher lors de l'exploration.
Après avoir corrigé le problème, vous pouvez vérifier si notre robot d'exploration voit le nouveau code de réponse à l'aide de l'outil Explorer comme Googlebot. Testez quelques URL et, si elles s'affichent correctement, ces erreurs devraient bientôt disparaître de votre liste d'erreurs d'exploration.
Q : Puis-je utiliser l'outil de suppression d'URL de Google pour que les erreurs 404
disparaissent de mon compte plus rapidement ?
R : Non. L'outil de demande de suppression d'URL supprime les URL des résultats de recherche Google, mais pas de votre compte dans les outils pour les webmasters. Il n'est conçu que pour les demandes de suppression urgentes. Il n'est pas nécessaire de l'utiliser lorsqu'une URL renvoie déjà une erreur 404
, car celle-ci disparaîtra naturellement de nos résultats de recherche au fil du temps. Consultez la deuxième moitié de cet article de blog pour en savoir plus sur ce que l'outil de suppression d'URL peut faire et ne peut pas faire pour vous.
Vous souhaitez toujours en savoir plus sur les erreurs 404
? Consultez la semaine 404
sur notre blog ou notre Forum d'aide pour les webmasters.