Как решить проблемы с нормализацией страниц

Чтобы узнать, какую страницу алгоритмы Google считают канонической, воспользуйтесь инструментом проверки URL. Даже если вы явно укажете канонический URL, Google может выбрать другую страницу. Это зависит от многих факторов, например от качества контента. Прежде чем приступать к устранению неполадок, проверьте, не является ли страница, выбранная Google, более привлекательной для пользователей, которые видят ваш сайт в результатах Поиска.

Есть несколько причин, по которым указанный Google вариант отличается от канонического URL, который вы хотите видеть в результатах Поиска. Ниже перечислены наиболее распространенные проблемы.

Распространенные проблемы с нормализацией страниц

Языковые варианты сайта без локализованных аннотаций

Если на нескольких ваших сайтах размещен практически одинаковый контент на разных языках, следуйте нашим рекомендациям в отношении локализованных версий страниц. Например, если существуют разные версии вашего сайта с одинаковым контентом для англоговорящих пользователей из США, Великобритании и Австралии, то добавьте для сайта аннотации hreflang. Это поможет пользователям из разных регионов видеть в результатах Поиска именно те страницы, которые для них предназначены.

Ошибки в канонических элементах

Некоторые системы управления контентом (CMS) или их плагины могут неправильно выполнять нормализацию, указывая на нежелательные URL. Чтобы узнать, так ли это, проверьте свой HTML с помощью инструментов разработчика в браузере. Неправильное использование элементов или переадресация rel="canonical" или 3xx может привести к непредвиденному изменению канонического URL вашего сайта. Если вы заметили подобную ошибку, обратитесь к своему поставщику CMS.

Ошибки в настройках серверов

Выбор основного URL вне вашего домена может быть связан с ошибками в настройках серверов, на которых размещен контент. Например:
  • Некорректно настроенный сервер может возвращать контент с сайта example.com в ответ на запрос URL с сайта other.example.
  • Два не связанных между собой сервера могут выдавать одинаковые страницы ошибок soft 404, которые не распознаются Google как сообщения об ошибках. Если вы считаете, что проблема заключается именно в этом, свяжитесь с вашим хостинг-провайдером.

Атаки злоумышленников

Некоторые виды хакерских атак заключаются в добавлении на сайт кода, который выполняет переадресацию 3xx HTTP или вставляет междоменную аннотацию link с атрибутом rel="canonical" в HTML-элемент <head> или HTTP-заголовок. В результате пользователь попадает на сайт, который содержит вредоносное ПО или спам. В таких случаях вместо настоящего URL взломанного сайта алгоритмы Google могут выбрать URL, указанный злоумышленником.

Скопированный контент

Элемент link с каноническим URL не рекомендуется использовать тем, кто хочет предотвратить дублирование своего контента партнерами по распространению, поскольку страницы часто сильно отличаются. Наиболее эффективное решение – попросить партнеров заблокировать индексирование вашего контента. Более подробная информация приведена в статье Как избежать дублирования статей в Google Новостях. В ней также представлены рекомендации о блокировке контента, скопированного из Google Поиска.

Поддельный сайт

В редких случаях алгоритмы Google могут выбрать URL внешней страницы, на которой без разрешения размещены копии ваших материалов. Если ваши материалы были опубликованы на другом сайте с нарушением авторских прав, обратитесь к владельцу сервера этого сайта с просьбой их убрать. Вы также можете запросить в Google удаление страницы с украденными материалами из результатов поиска в связи с нарушением закона США "Об авторском праве в цифровую эпоху" (DMCA).

Обратите внимание, что если канонический URL относится к ресурсу Search Console, который вам не принадлежит, то вы не сможете отслеживать трафик на странице-копии.