规范化是指选择一段内容的有代表性的规范网址的过程。因此,规范网址是指 Google 从一组重复网页中选出的最具代表性的网页的网址。此过程通常称为重复信息删除,有助于 Google 在搜索结果中仅显示重复内容的一个版本。
网站包含重复内容的原因有很多:
区域变体:例如,面向美国和英国的一段内容可通过不同的网址访问,但实质上是同一语言的相同内容
设备变体:例如,一个网页既有移动版又有桌面版
协议变体:例如,网站的 HTTP 版本和 HTTPS 版本
网站函数:例如,类别网页的排序函数和过滤函数的结果
意外变体:例如,网站的演示版本意外仍可供抓取工具访问
网站上的某些重复内容是正常的,并不违反 Google 的垃圾内容政策。但是,多个不同网址访问的是相同内容可能会导致用户体验不佳(例如,用户可能会想知道哪个是正确的网页,以及两者之间是否存在差异),可能会让您更难跟踪自己的内容在搜索结果中的表现。
Google 如何将网站编入索引并选择规范网址
Google 将网页编入索引时,会确定每个网页的主要内容(或“核心”)。如果 Google 发现多个网页似乎相同或者主要内容非常相似,则会根据索引编制流程收集的因素(或“信号”)来选择客观来说对搜索用户而言最完整、最实用的网页,并将其标记为规范网页。为了减少 Google 对网站的抓取工作量,我们会经常抓取规范网页,而不会频繁地抓取重复网页。
有一些因素会影响规范化:网页是通过 HTTP 还是 HTTPS 提供、重定向、站点地图中是否出现了相应网址,以及 rel="canonical"link 注释。您可运用上述方法告知 Google 您更愿意使用哪个网页,但 Google 仍可能会因各种原因另选一个网页作为规范网页。也就是说,指明首选规范网页是一个提示,而非规则。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-02-17。"],[[["Canonicalization is the process of choosing the best URL from a set of duplicate pages on a website."],["Google uses signals like HTTPS, sitemaps, and redirects to determine the canonical URL, aiming to show users the most relevant and complete version of a page."],["While website owners can suggest a preferred canonical URL, Google's algorithms may ultimately select a different URL based on various factors."],["Duplicate content arising from regional or device variations is common and not inherently problematic, but managing it can improve user experience and search performance."],["Google primarily uses the canonical version for content evaluation and search results, but may prioritize other versions (e.g., mobile) based on user context."]]],[]]