Оптимизируйте свои подборки
Сохраняйте и классифицируйте контент в соответствии со своими настройками.
Как управлять сканированием URL при использовании фасетной навигации
Фасетная навигация – это часто используемая на сайтах функция, позволяющая посетителям выбирать, как на страницах будут выглядеть различные объекты (например, товары, статьи или сведения о мероприятиях). Она популярна у разработчиков и удобна для пользователей, однако самая распространенная ее версия (основанная на параметрах URL) может приводить к появлению бесконечных пространств URL, что создает следующие проблемы для сайта:
Избыточное сканирование. URL, созданные для фасетной навигации, воспринимаются как новые, а поисковые роботы не могут без сканирования определить, окажется ли URL полезным. В результате им приходится обрабатывать большое количество URL фасетной навигации, прежде чем становится понятно, что это ненужные URL.
Медленное сканирование новых страниц. Из сказанного выше следует, что, если поисковые роботы заняты сканированием бесполезных URL, у них остается меньше времени на поиск новых нужных URL.
В строке запроса у типичного URL фасетной навигации может быть много разных параметров, связанных со свойствами фильтруемых объектов. Пример:
Если изменить такие параметры URL, как products, color и size, то на странице, к которой он относится, будет показан другой набор объектов. Это значит, что сочетаний критериев фильтрации может быть очень много, вследствие чего возможных URL тоже будет много. Сберечь ресурсы в такой ситуации вам помогут следующие методы:
Если вам не нужно индексировать URL фасетной навигации, запретите их сканирование.
Если такие URL должны индексироваться, следуйте нашим рекомендациям из раздела ниже. Примите во внимание, что обычно при сканировании URL фасетной навигации должно быть обработано огромное число URL и выполнено множество операций, необходимых для отрисовки таких страниц. На это расходуется большой объем вычислительных ресурсов сервера, на котором размещен сайт.
Как ограничить сканирование URL фасетной навигации
Если вы хотите сберечь ресурсы сервера и вам не нужно, чтобы URL фасетной навигации показывались в Google Поиске, вы можете ограничить сканирование этих URL следующими способами:
Запретите сканирование URL фасетной навигации, используя файл robots.txt. Обычно сканировать отфильтрованные объекты не нужно, так как на это без какой-либо необходимости тратятся ресурсы сервера. Разрешите сканирование страниц отдельных объектов и страницы, на которой показаны все товары без фильтрации.
Указывайте критерии фильтрации, используя фрагменты URL.В целом Google Поиск не поддерживает фрагменты URL при сканировании и индексировании.
Если ваш механизм фильтрации основан на фрагментах URL, он не будет влиять на сканирование (ни положительно, ни отрицательно). Вот пример того, как можно использовать фрагменты URL вместо параметров URL:
Ещё два способа указать, какие URL фасетной навигации нужно или не нужно сканировать, – это использовать тег link с атрибутом rel="canonical" и атрибут анкера rel="nofollow". Однако эти методы менее эффективны в долгосрочной перспективе, чем ранее упомянутые.
Если вы используете атрибут rel="canonical" для того, чтобы указать, какой URL является канонической версией URL, предназначенного для фасетной навигации, то частота сканирования неканонических версий этих URL со временем может снизиться. Например, если у вас три типа страниц с фильтрами, можно добавить атрибут rel="canonical" для версии без фильтров, т. е. тег <link rel="canonical" href="https://example.com/items.shtm?products=fish" > будет указывать на каноническую версию URL https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny.
Можно использовать атрибуты rel="nofollow" в анкерах, указывающих на страницы с отфильтрованными результатами, но при этом у каждого анкера, указывающего на конкретный URL, должен быть атрибут rel="nofollow", иначе он не будет работать эффективно.
Как проверить, оптимизированы ли URL фасетной навигации для сайтов
Если ваши URL, предназначенные для фасетной навигации, нужно сканировать и индексировать, воспользуйтесь рекомендациями ниже. Они помогут вам минимизировать проблемы, связанные с обработкой большого количества возможных URL на вашем сайте.
Используйте стандартный для отрасли разделитель & между параметрами URL. Поисковым роботам сложно понять, что запятая (,), точка с запятой (;) и скобки ([ и ]) могут служить разделителями параметров, поскольку в большинстве случаев они таковыми не являются.
Если вы кодируете фильтры в пути URL (например, они могут выглядеть как /products/fish/green/tiny), убедитесь, что фильтры всегда указываются в одном порядке и не дублируются.
Возвращайте код статуса 404, если при использовании определенной комбинации фильтров не возвращается результат.
Предположим, на вашем сайте нет такого товара, как рыба гирелла (green fish). В этом случае пользователи и поисковые роботы должны видеть ошибку "Не найдено" с соответствующим ей кодом статуса HTTP (404). То же самое должно происходить, если URL содержит фильтры-дубликаты или невозможные сочетания фильтров, а также относится к несуществующей странице. Кроме того, если сочетание фильтров не дает результатов, не перенаправляйте пользователя на общую страницу с ошибкой "Не найдено". Вместо этого показывайте ошибку "Не найдено" с кодом статуса HTTP 404 для URL, который привел к ее появлению.
[[["Прост для понимания","easyToUnderstand","thumb-up"],["Помог мне решить мою проблему","solvedMyProblem","thumb-up"],["Другое","otherUp","thumb-up"]],[["Отсутствует нужная мне информация","missingTheInformationINeed","thumb-down"],["Слишком сложен/слишком много шагов","tooComplicatedTooManySteps","thumb-down"],["Устарел","outOfDate","thumb-down"],["Проблема с переводом текста","translationIssue","thumb-down"],["Проблемы образцов/кода","samplesCodeIssue","thumb-down"],["Другое","otherDown","thumb-down"]],["Последнее обновление: 2025-08-04 UTC."],[],["Faceted navigation URLs, often using parameters, can lead to overcrawling and slower discovery of new content. To manage this, prevent crawling of these URLs using `robots.txt` to disallow specific parameters or employ URL fragments instead of parameters. Alternatively, use `rel=\"canonical\"` or `rel=\"nofollow\"` to reduce crawling of these pages. If faceted URLs are needed, utilize `&` for parameters, maintain consistent filter order, and return `404` for no-result combinations.\n"],null,["# Managing crawling of faceted navigation URLs | Google Search Central\n\nManaging crawling of faceted navigation URLs\n============================================\n\n\nFaceted navigation is a common feature of websites that allows its visitors to change how items\n(for example, products, articles, or events) are displayed on a page. It's a popular and useful\nfeature, however its most common implementation, which is based on URL parameters, can generate\ninfinite URL spaces which harms the website in a couple ways:\n\n- **Overcrawling**: Because the URLs created for the faceted navigation seem to be novel and crawlers can't determine whether the URLs are going to be useful without crawling first, the crawlers will typically access a very large number of faceted navigation URLs before the crawlers' processes determine the URLs are in fact useless.\n- **Slower discovery crawls**: Stemming from the previous point, if crawling is spent on useless URLs, the crawlers have less time to spend on new, useful URLs.\n\n\nA typical faceted navigation URL may contain various parameters in the query string related to the\nproperties of items they filter for. For example: \n\n```\nhttps://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny\n```\n\n\nChanging any of the URL parameters `products`, `color`, and\n`size` would show a different set of items on the underlying page. This often means a\nvery large number of possible combinations of filters, which translates to a very large number of\npossible URLs. To save your resources, we recommend dealing with these URLs one of the following\nways:\n\n- If you don't need the faceted navigation URLs potentially indexed, prevent crawling of these URLs.\n- If you need the faceted navigation URLs potentially indexed, ensure that the URLs follow our best practices outlined in the following section. Keep in mind that crawling faceted URLs tends to cost sites large amounts of computing resources due to the sheer amount of URLs and operations needed to render those pages.\n\nPrevent crawling of faceted navigation URLs\n-------------------------------------------\n\n\nIf you want to save server resources and you don't need your faceted navigation URLs to show up in\nGoogle Search, you can prevent crawling of these URLs with one of the following ways.\n\n- **Use [robots.txt](/search/docs/crawling-indexing/robots/intro) to disallow crawling of faceted navigation URLs.** Oftentimes there's no good reason to allow crawling of filtered items, as it consumes server resources for no or negligible benefit; instead, allow crawling of just the individual items' pages along with a dedicated listing page that shows all products without filters applied. \n\n ```\n user-agent: Googlebot\n disallow: /*?*products=\n disallow: /*?*color=\n disallow: /*?*size=\n allow: /*?products=all$\n ```\n- **Use URL fragments to specify filters.** [Google Search generally doesn't support URL fragments in crawling and indexing](/search/docs/crawling-indexing/url-structure#fragments). If your filtering mechanism is based on URL fragments, it will have no impact on crawling (positive or negative). For example, instead of URL parameters, use URL fragments: \n\n ```\n https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny\n ```\n\n\nOther ways to signal a preference of which faceted navigation URLs (not) to crawl is using\n`rel=\"canonical\"` `link` element and the `rel=\"nofollow\"` anchor\nattribute. However, these methods are generally less effective in the long term than the\npreviously mentioned methods.\n\n- **Using [`rel=\"canonical\"`](/search/docs/crawling-indexing/consolidate-duplicate-urls#rel-canonical-link-method)\n to specify which URL is the canonical version of a faceted navigation URL** may, over time, decrease the crawl volume of non-canonical versions of those URLs. For example, if you have 3 filtered page types, consider pointing the `rel=\"canonical\"` to the unfiltered version: `https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny` specifies `\u003clink rel=\"canonical\" href=\"https://example.com/items.shtm?products=fish\" \u003e`.\n- **Using\n [`rel=\"nofollow\"`](/search/docs/crawling-indexing/qualify-outbound-links#nofollow)\n attributes on anchors pointing to filtered results pages** may be beneficial, however keep in mind that every anchor pointing to a specific URL must have the `rel=\"nofollow\"` attribute in order for it to be effective.\n\nEnsure the faceted navigation URLs are optimal for the web\n----------------------------------------------------------\n\n\nIf you need your faceted navigation URLs to be potentially crawled and indexed, ensure you're\nfollowing these best practices to minimize the negative effects of crawling the large number of\npotential URLs on your site:\n| Keep in mind that having these URLs crawled means an increased resource usage on your server and, potentially, slower discovery of new URLs on your site.\n\n1. **Use the industry standard URL parameter separator '`&`'.** Characters like comma (`,`), semicolon (`;`), and brackets (`[` and `]`) are hard for crawlers to detect as parameter separators (because most often they're not separators).\n2. If you're encoding filters in the URL path, such as `/products/`**fish** `/`**green** `/`**tiny**, ensure that the logical order of the filters always stays the same and that no duplicate filters can exist.\n3. **Return an HTTP `404` status code when a filter combination doesn't return\n results.** If there are no green fish in the site's inventory, users as well as crawlers should receive a \"not found\" error with the proper HTTP status code (`404`). This should also be the case if the URL contains duplicate filters or otherwise nonsensical filter combinations, and nonexistent pagination URLs. Similarly, if a filter combination has no results, don't redirect to a common \"not found\" error page. Instead, serve a \"not found\" error with the `404` HTTP status code under the URL where it was encountered. If [you have a single-page app](/search/docs/crawling-indexing/javascript/javascript-seo-basics#avoid-soft-404s) this might not be possible. Follow the best practices for single page apps."]]