Как не допустить спам, созданный пользователями, на свой сайт

Спамеры часто пользуются открытым доступом к разделам сайта, где пользователи могут размещать свой контент, например к формам для комментариев. Не обходят они вниманием и хостинговые платформы, создавая на них множество сайтов, которые нарушают наши правила в отношении спама для веб-поиска Google и не содержат полезных материалов.

Предотвратить нарушение правил использования сайта или платформы, как правило, не сложно. Даже простая мера сдерживания, например необходимость выполнить необычное задание перед совершением тех или иных действий на вашем ресурсе, может создать проблемы для спамеров.

Сообщите пользователям, что в вашем сервисе запрещен спам

Разработайте четкие правила в отношении использования своих услуг и сообщите о них посетителям (например, во время регистрации). Кроме этого, предоставьте доверенным пользователям возможность сообщать о любом контенте на вашем сайте, который похож на спам.

Выявляйте аккаунты, содержащие спам

Ведите учет регистрации аккаунтов и прочих действий пользователей и выявляйте типичные признаки спама. Например, обращайте внимание на следующее:

  • время заполнения формы регистрации;
  • количество запросов с одного диапазона IP-адресов;
  • характерные названия агентов пользователя;
  • совпадение имен пользователей или другие одинаковые значения в полях формы регистрации.

Эти сигналы можно использовать при создании репутационной системы. Она не только повысит интерес пользователей к сайту, но и поможет выявлять злоумышленников. Многие спамеры хотят, чтобы их комментарии показывались в результатах поиска. Поэтому мы рекомендуем добавлять метатег robots с директивой noindex в разделы с записями новых пользователей, которые пока не заработали никакой репутации. По достижении пользователем определенного уровня можно разрешить индексацию опубликованного им контента. Как правило, после этого спамеры могут уйти с вашей платформы.

Поскольку злоумышленников привлекает возможность оставлять ссылки на их сайты, рекомендуем настроить добавление атрибута rel с директивой nofollow или ugc во все ссылки в непроверенном контенте.

Введите модерацию действий пользователей

Предварительная проверка (или модерация) определенных действий пользователей позволяет значительно сократить количество спама, поскольку мешает злоумышленникам мгновенно размещать нежелательный контент. Модерация добавляет владельцам сайтов ежедневной рутины, но зато позволяет эффективно бороться со спамом. Ее эффективность доказывается тем фактом, что функция модерации комментариев присутствует в большинстве систем управления контентом.

Создавайте черные списки спамеров

Как только вы найдете один профиль, являющийся источником спама, удалить остальные будет проще. Зачастую они создаются с одного и того же IP-адреса. После выявления внесите его в черный список. Для систем управления контентом (к примеру, WordPress) существуют специальные плагины, позволяющие решать подобные задачи (например, Akismet), однако столь же эффективным будет добавлять такие IP-адреса в черный список брандмауэра.

Исключите возможность автоматической регистрации аккаунтов

Применяйте инструмент reCAPTCHA или аналогичные механизмы во время регистрации, чтобы исключить автоматическое создание большого количества сайтов с помощью скриптов.

Отслеживайте нарушения правил использования сервиса

  • Анализируйте статистику своего ресурса и обращайте внимание на признаки спама: переадресации, чрезмерное количество разделов с рекламой, связанные со спамом ключевые слова, а также крупные блоки обфусцированного кода JavaScript. Выявлять подобные проблемы вам помогут оператор поиска site: и сервис Google Оповещения.
  • Регулярно проверяйте файлы журнала своего веб-сервера, чтобы не пропустить скачки трафика.
  • Выявляйте на своем ресурсе страницы, созданные с целью фишинга или зараженные вредоносным ПО. В частности, при проверке URL на предмет подобных проблем вы можете использовать API Google для безопасного просмотра веб-страниц.
  • Руководствуйтесь здравым смыслом. Например, если ваша основная аудитория – пользователи из России, но внезапно на вашем ресурсе за сутки было совершено несколько тысяч действий с итальянского IP-адреса, это подозрительный знак. Для определения языка недавно созданных сайтов можно использовать различные инструменты, например специальные библиотеки или Google Translate API (версия 2).