使用 noindex 禁止 Google 搜尋建立索引

noindex 是具有 <meta> 標記或 HTTP 回應標頭的規則組合,可用來防止支援 noindex 規則的搜尋引擎 (例如 Google) 將內容編入索引。這樣一來,Googlebot 檢索該網頁並擷取 noindex 標記或標頭時,就會將該網頁完全排除在 Google 搜尋結果之外,不論是否有其他網站連結到該網頁,結果都一樣。

如果您沒有自身伺服器的根存取權,就很適合使用 noindex,因為這樣可以視個別網頁情況,控制網站存取權。

實作 noindex

實作 noindex 的方法有兩種,分別是使用 <meta> 標記和 HTTP 回應標頭。這兩種做法的效果相同,請依照內容類別和網站情形選擇適合的即可。Google 不支援在 robots.txt 檔案中指定 noindex 規則。

您也可以將 noindex 規則與可以控制索引的其他規則合併。舉例來說,您可以使用 noindex 規則加入 nofollow 提示:<meta name="robots" content="noindex, nofollow" />

<meta> 標記

如要防止所有支援 noindex 規則的搜尋引擎將網站上的網頁編入索引,請在網頁的 <head> 區段中加入下列 <meta> 標記:

<meta name="robots" content="noindex">

如要「專門防止 Google 網路檢索器」將特定網頁編入索引,請放入下列中繼標記:

<meta name="googlebot" content="noindex">

提醒您,有些搜尋引擎對 noindex 規則可能有不同的解譯方式,因此您的網頁仍可能出現在這些搜尋引擎的結果中。

進一步瞭解 noindex <meta> 標記

HTTP 回應標頭

您可以在回應中傳回值為 noindexnoneX-Robots-Tag HTTP 標頭,而不是 <meta> 標記。回應標頭可用於非 HTML 資源,例如 PDF、影片檔案和圖片檔。以下範例說明如何在 HTTP 回應中利用 X-Robots-Tag 標頭指示搜尋引擎不要將網頁編入索引:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

進一步瞭解 noindex 回應標頭

偵錯 noindex 問題

我們必須檢索您的網頁才能看到 <meta> 標記和 HTTP 標頭。如果有網頁仍顯示在搜尋結果中,可能是因為我們在您新增 noindex 規則後還未檢索過該網頁,根據網頁在網際網路上的重要性,Googlebot 可能需要經過幾個月的時間才會重新造訪網頁。您可以使用網址檢查工具要求 Google 重新檢索網頁。

如果您需要立即從 Google 搜尋結果中移除您網站的網頁,請參閱移除作業的說明文件

此外,也可能是因為 robots.txt 檔案禁止 Google 網路檢索器存取該網址,才導致檢索器看不到標記。這種情況下,為了讓 Google 能夠存取網頁,您必須編輯 robots.txt 檔案

最後,請確認 Googlebot 可以看見 noindex 規則。如要測試 noindex 實作是否正確,請使用網址檢查工具查看 Googlebot 在檢索網頁時收到的 HTML。您也可以在 Search Console 中使用網頁索引報表,監控 Googlebot 從您網站上擷取 noindex 規則的網頁。