避免建立重複的內容

重複內容通常是指一或多個網域中,完全或大致與其他內容相符的實質內容區塊。一般而言,重複內容本身並不構成欺騙行為。非惡意的重複內容可能包括:

  • 可針對行動裝置產生一般網頁和精簡網頁的論壇
  • 透過多個不同網址顯示或連結的網路商店品項
  • 列印專用的網頁

如果您的網站有許多網頁上的內容基本上都相同,那麼您可以透過幾種不同的方式來向 Google 指示您的偏好網址為何 (這稱為「標準化」)。進一步瞭解標準化

但在某些情況下,有心人士會故意在整個網域中置入大量重複內容,試圖操控搜尋引擎的排名或贏得更多的流量。這種欺騙行為會讓訪客在多個搜尋結果中看到大致相同的內容,因此可能對使用者體驗帶來負面影響。

Google 致力於為含有不同資訊的網頁建立索引,並將這些網頁提供給搜尋結果的使用者。舉例來說,假設您網站的每篇文章都有「普通」和「列印」版本,而且都沒有使用 noindex 標記封鎖,那麼我們會加以篩選,只在搜尋結果中列出其中一種版本。在極少數情況下,Google 會發現有網站為了操控排名和欺騙使用者而顯示重複內容,針對涉嫌採取這些手段的網站,我們會對其索引和排名做出適當調整。因此,網站的排名會降低,或者網站會從 Google 索引中完全移除,而不再出現於搜尋結果中。

您可以採取一些步驟主動處理重複內容問題,並確保網站能向訪客顯示您指定的內容。

  • 使用 301 重新導向機制:如果您已重新建構網站,請在您的 .htaccess 檔案中使用 301 重新導向 (也就是「RedirectPermanent」) 來對使用者、Googlebot 和其他自動尋檢程式進行智慧型重新導向 (您可以透過 Apache 中的 .htaccess 檔案或 IIS 的管理控制台執行這項作業)。
  • 保持一致:請盡量保持內部連結的一致性。舉例來說,請勿連結至 http://www.example.com/page/http://www.example.com/pagehttp://www.example.com/page/index.htm
  • 使用頂層網域:為了協助我們提供最適當版本的文件,請盡可能使用上層網域來處理國家/地區專屬內容。例如,與 http://www.example.com/dehttp://de.example.com 相比,我們更容易看出 http://www.example.de 中含有專為德國提供的內容。
  • 謹慎聯合發布:如果您以聯合發布方式在其他網站發布內容,在每一次相關搜尋中,Google 會一律顯示我們認為最適合使用者的版本,不一定是您偏好的版本。不過,仍建議您確保在聯合發布您內容的每個網站上都有原始文章連結。您也可以要求聯合發布內容的採用者在其網站上加入 noindex 標記,以免搜尋引擎為他們的內容版本建立索引。
  • 盡量減少一成不變的重複內容:舉例來說,不要在每一頁下方都放入冗長的版權文字,可改為提供簡短摘要,並附上更多詳細資料的網頁連結。此外,您可以使用「參數處理」工具來指定 Google 處理網址參數的方式。
  • 避免發佈不完整的內容:使用者不喜歡看到「空白」網頁,因此請儘可能避免使用預留位置。例如,請不要發布尚未包含實際內容的網頁。如果您仍要建立預留網頁,請使用 noindex 標記封鎖這些網頁,避免 Google 建立索引。
  • 瞭解您的內容管理系統:請務必熟悉網站顯示內容的方式。網誌、論壇和相關的系統通常會以多種格式顯示相同的內容。舉例來說,網誌項目可能會顯示於網誌首頁或封存網頁,也可能與標籤相同的其他項目出現在同一個網頁上。
  • 儘量減少相似的內容:如果您有許多相似的網頁,請考慮擴充各網頁的內容,或將其合併成一個網頁。例如,如果您有一個旅遊網站,分別為兩個城市設立了單獨的網頁,但網頁內容實際相同,那麼您可以將這些網頁合併成一個集中介紹這兩個城市的網頁,或者分別擴充每個網頁以介紹每個城市的特色。

Google 不建議透過 robots.txt 檔案或其他方式禁止檢索器存取網站上的重複內容。如果搜尋引擎無法檢索含有重複內容的網頁,就無法透過自動偵測發現這些網址指向相同內容,這樣會導致搜尋引擎誤將這些網址視為獨立的不重複網頁。較佳的做法是允許搜尋引擎檢索這些網址,但使用 rel="canonical" link 元素、網址參數處理工具或 301 重新導向等方式,將這些網址標示為重複內容。為避免系統因重複內容而過度檢索您的網站,您也可以在 Search Console 中調整檢索頻率設定

我們並不會因為重複內容而對網站採取處置,除非這類內容的用途是欺騙他人及操控搜尋引擎結果。當重複內容問題對您的網站造成不良影響時,如果您並未按照上述建議修正問題,我們就會妥善選擇搜尋結果顯示的內容版本。

不過,一旦我們在審查後判定您涉及欺騙行為,並將您的網站從搜尋結果中移除,您就必須仔細檢查網站。如果您的網站已從我們的搜尋結果中移除,請檢閱我們的《網站管理員指南》,以取得詳細資訊。當您完成變更,並確認網站內容已完全符合指南規範後,請提交網站重審要求

在少數情況下,我們的演算法所選取的網址可能屬於未經授權即發布您內容的外部網站。如果您認為其他網站複製您內容的方式違反了版權法,請與該網站的負責人聯絡,要求對方移除涉及侵權的內容。此外,您也可以根據《數位千禧年著作權法》(DMCA) 提出要求,請 Google 從搜尋結果中移除侵權網頁。