Notre lutte contre le spam dans la recherche Google en 2021

Jeudi 21 avril 2022

Googlebot et son ami Crawley, consultant le rapport 2021 sur le spam sur un ordinateur portable

En 2021, les internautes du monde entier ont effectué des recherches pour savoir comment guérir et comment revenir plus fort. Pour les aider à trouver des informations utiles à toutes leurs questions, des plus simples aux plus complexes, nous nous sommes efforcés de lutter le spam et les contenus malveillants dans la recherche.

SpamBrain : notre solution la plus efficace contre le spam

Nous avons identifié 200 fois plus de sites contenant du spam en 2021 qu'à nos débuts il y a presque 20 ans, en partie grâce à notre système de prévention du spam basé sur l'IA appelé SpamBrain.

Dessin représentant SpamBrain avec Googlebot qui regarde une page

SpamBrain a été lancé en 2018 et nous améliorons sans cesse ses performances. En 2021, SpamBrain a identifié près de six fois plus de sites contenant du spam qu'en 2020. Le volume de sites pirates, un type de spam courant en 2020, a donc considérablement baissé (70 %). C'est également le cas des sites présentant du contenu vide de sens sur les plates-formes d'hébergement (75 %). Autre fonctionnalité remarquable : SpamBrain est conçu pour être une plate-forme robuste, en constante évolution et adaptée à tous les types d'abus.

Face à l'augmentation du volume de spam sophistiqué produit chaque jour, nous avons pu proposer des résultats sans spam pour plus de 99 % des recherches grâce à SpamBrain qui a permis d'identifier des comportements pernicieux et malveillants parmi des milliards de pages Web.

Protéger la qualité de la recherche et la sécurité des utilisateurs

En 2021, nous avons fait d'importants progrès dans plusieurs domaines en dehors de la lutte contre le spam traditionnel, en particulier concernant le spam dans les liens, les escroqueries et le harcèlement en ligne.

Les liens nous permettent toujours d'identifier et de classer les résultats de façon cohérente. Nous avons fait de nombreux progrès en 2021 pour protéger ce signal essentiel. Nous avons lancé une mise à jour pour la lutte contre le spam dans les liens afin d'identifier les liens artificiels et d'éviter qu'ils n'affectent la qualité de la recherche.

Les escroqueries constituent une menace importante pour la sécurité des utilisateurs en ligne. En nous appuyant sur notre travail en 2020, nous avons lancé plusieurs mises à jour d'algorithmes qui ont entraîné une réduction de 40 % des résultats comportant des escroqueries. L'amélioration de la couverture nous a permis de protéger les utilisateurs de nombreux types d'escroqueries autres que celles dites du "faux service client" contre lesquelles nous nous battons depuis plusieurs années.

Pour assurer la sécurité des utilisateurs, nous avons développé d'autres fonctionnalités de SpamBrain en vue de faire face au harcèlement en ligne et, pour les requêtes incluant des noms d'utilisateurs, réduire la proéminence des sites dont les pratiques en matière de suppression de contenu sont abusives.

Réduire les effets de la manipulation du classement

Outre le spam, nous nous efforçons de réduire le volume de contenus de faible qualité et les manipulations du classement en luttant contre les comportements qui visent à éviter de justesse le non-respect des consignes relatives à la qualité, mais qui sont tout de même manipulateurs et qui nuisent à l'expérience utilisateur.

Par exemple, l'un de ces comportements consistait à optimiser le classement des requêtes concernant les avis sur les produits dont le contenu correspondait souvent à des réécritures de descriptions de produits, et non à des avis authentiques d'utilisateurs ayant réellement testé les produits. En 2021, nous avons apporté deux mises à jour importantes à notre méthode d'évaluation des avis sur les produits. Ces changements ont entraîné une baisse importante du nombre d'avis de faible qualité, tandis que les avis présentant un contenu et une expertise de meilleure qualité ont été mis en avant.

Nous voulons nous assurer que rien n'empêche les utilisateurs d'avoir accès aux contenus les plus utiles via la recherche. Si vous constatez des comportements manipulateurs dans les résultats de recherche, vous pouvez nous envoyer vos commentaires directement depuis la page des résultats de recherche.

Posté par Cody Kwok, ingénieur principal