避免建立重複的內容

重複內容通常是指一或多個網域中,完全或大致與其他同樣語言的內容相符的實質內容區塊。一般而言,重複內容本身並不構成欺騙行為。非惡意的重複內容可能包括:

  • 會產生一般網頁和行動裝置專用精簡網頁的論壇
  • 在網路商店中,能透過多個不同網址顯示或連結的商品
  • 列印專用的網頁

如果您的網站有許多內容大致相同的網頁,那麼您可以透過幾種不同的方式告知 Google 您偏好的網址,這項作業稱為「標準化」。 進一步瞭解標準化

但在某些情況下,有心人士會故意在多個網域中置入重複內容,試圖操控搜尋引擎的排名或贏得更多的流量。這種欺騙行為會讓訪客在多個搜尋結果中看到大致相同的內容,導致使用者體驗大打折扣。

Google 致力於將含有不同資訊的網頁編入索引,並向使用者呈現這些各自擁有獨特內容的網頁。舉例來說,假設您網站的每篇文章都有「普通」和「列印」版本,而且兩者都沒有使用 noindex 標記封鎖,那麼我們會加以篩選,只在搜尋結果中列出其中一種版本。在極少數情況下,Google 會發現有網站為了操控排名和欺騙使用者而顯示重複內容,針對涉嫌採取這些手段的網站,我們會對其索引和排名做出適當調整。這類調整會造成網站排名降低,或者可能導致網站從 Google 索引中完全移除,而不再出現於搜尋結果中。

您可以透過以下幾項步驟主動處理重複內容問題,確保網站能向訪客顯示您希望呈現的內容。

  • 使用 301 重新導向機制:如果您重新建構了網站,請在 .htaccess 檔案中使用 301 重新導向 (也就是「RedirectPermanent」),即可巧妙地為使用者、Googlebot 和其他自動尋檢程式進行重新導向。在 Apache 中,您可以使用 .htaccess 檔案執行此作業;在 IIS 中,則可以透過管理控制台執行。
  • 保持一致:請盡量保持內部連結的一致性。舉例來說,請勿連結至 http://www.example.com/page/http://www.example.com/pagehttp://www.example.com/page/index.htm
  • 使用頂層網域:為協助我們將最適當版本的文件提供給使用者,請盡可能使用上層網域來處理國家/地區專屬內容。例如,與 http://www.example.com/dehttp://de.example.com 相比,我們更容易看出 http://www.example.de 中含有專為德國提供的內容。
  • 謹慎使用聯合發布:如果您以聯合發布方式在其他網站發布內容,在每次相關搜尋中,Google 會一律顯示我們認為最適合使用者的版本,而這不一定是您偏好的版本。不過,我們仍建議您確保在聯合發布內容的每個網站上都有您的原始文章連結。您也可以要求聯合發布內容的採用者在其網站上加入 noindex 標記,以免搜尋引擎為他們的內容版本建立索引。
  • 盡量減少一成不變的重複內容:舉例來說,不要在每個網頁下方都放入冗長的版權文字,建議改為提供簡短摘要,並附上詳細資料網頁的連結。此外,您可以使用「參數處理」工具來指定 Google 處理網址參數的方式。
  • 避免發布不完整的內容:使用者不喜歡看到「空白」網頁,因此請盡可能避免使用預留網頁,例如,請不要發布還沒有實際內容的網頁。如果確實需要建立預留網頁,請使用 noindex 標記加以封鎖,避免 Google 為其建立索引。
  • 瞭解您的內容管理系統:請務必熟悉網站顯示內容的方式。網誌、論壇和相關系統通常會以多種格式顯示相同的內容,舉例來說,單篇網誌文章可能會顯示在網誌首頁和封存網頁中,也可能與標籤相同的其他文章出現在同一個網頁上。
  • 盡量減少相似內容:如果您有許多相似的網頁,請考慮擴充各網頁的內容,或將其合併成一個網頁。舉例來說,假設您在同個旅遊網站上為兩個城市分別建立網頁,但兩者的內容其實相同,這時候可以將兩者合併為同時介紹兩個城市的單一網頁,或者,您可以擴增兩個網頁的內容,分別介紹兩個城市的特色。

Google 不建議透過 robots.txt 檔案或其他方式禁止檢索器存取網站上的重複內容。這是因為,如果搜尋引擎無法檢索含有重複內容的網頁,就無法透過自動偵測發現這些網址指向相同內容,這樣會導致搜尋引擎誤將這些網址視為獨立的不重複網頁。較佳的做法是允許搜尋引擎檢索這些網址,但使用 rel="canonical" link 元素、網址參數處理工具或 301 重新導向等方式,將這些網址標示為重複內容。 為避免系統因重複內容而過度檢索您的網站,您也可以在 Search Console 中調整檢索頻率設定

除非重複內容的用意是為了欺騙他人及操控搜尋引擎結果,否則擁有重複內容並不會讓網站受到處置。當重複內容問題對您的網站造成不良影響時,如果您並未按照本文件中的建議來修正問題,我們也會妥善選擇要在搜尋結果中顯示的內容版本。

不過,一旦我們在審查後判定您涉及欺騙行為,並將您的網站從搜尋結果中移除,您就必須仔細檢查網站。如果我們已經將您的網站從搜尋結果中移除,請詳閱網站管理員指南,進一步瞭解詳細資訊。當您完成變更並確認網站內容已完全符合指南規範後,請提交網站重審要求

在少數情況下,我們的演算法所選取的網址可能屬於未經授權即發布您內容的外部網站。如果您認為其他網站複製您內容的方式違反了版權法,請與該網站的負責人聯絡,要求對方移除涉及侵權的內容。此外,您也可以根據《數位千禧年著作權法》(DMCA) 提出申訴,要求 Google 從搜尋結果中移除侵權網頁。