Google 能夠識別的特殊標記

Google 支援網頁層級中繼標記和內嵌指令,您可以透過這兩種功能來管控網頁在 Google 搜尋結果中的顯示方式。

對網站擁有者來說,網頁層級中繼標記是向搜尋引擎提供網站相關資訊的絕佳途徑。中繼標記可以用來提供資訊給各類用戶端,每一個系統都僅會處理它們理解的中繼標記,並忽略其他類型的標記。中繼標記應置於 HTML 網頁的 <head> 部分,通常會像這樣:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="Description" CONTENT="Author: A.N. Author, Illustrator: P. Picture, Category: Books, Price:  £9.24, Length: 784 pages">
    <meta name="google-site-verification" content="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>
    <title>Example Books - high-quality used books for children</title>
    <meta name="robots" content="noindex,nofollow">
  </head>
</html>

Google 可以識別下列中繼標記 (這份清單中僅列出部分示例):

Google 能夠識別的中繼標記
<meta name="description" content="A description of the page" /> 這個標記的作用是提供簡短的網頁說明。在某些情況下,這則說明會用於搜尋結果中所顯示的網頁摘要
<meta name="robots" content="..., ..." />

<meta name="googlebot" content="..., ..." />

這些中繼標記可以控制搜尋引擎檢索及建立索引的行為。

<meta name="robots"> 標記適用於所有搜尋引擎,而 <meta name="googlebot"> 則為 Google 專用標記。

robotsgooglebot 中繼標記之間有衝突時,會以限制較多的標記為準。舉例來說,如果網頁同時具有 max-snippet:50nosnippet 標記,則會套用 nosnippet 標記。

預設值是 "index, follow",您不需要特別指定。Google 可以識別下列幾個值 (指定多個值時,請用逗號分隔):

  • index - 允許搜尋引擎為網頁建立索引。
  • follow - 在檢索網頁時追蹤其中包含的任何連結。
  • noindex - 禁止搜尋引擎為網頁建立索引。
  • nofollow - 在檢索網頁時不要追蹤其中的連結。
  • nosnippet - 禁止在搜尋結果中顯示文字摘要或影片預覽畫面。如果是影片,會盡可能改為顯示靜態圖片。範例: <meta name="robots" content="nosnippet">
  • max-snippet:[number] - 將這個網頁的文字摘要長度限制在 [<數字>] 個字元以內。指定 0 代表不要顯示網頁摘要;指定 -1 代表由 Google 決定摘要的長度,Google 會以最能有效協助使用者找到您內容,並將使用者導向您網站為判斷標準。
  • max-image-preview:[size] - 限制這個網頁所有相關圖片的尺寸。[<尺寸>] 可以是「none」、「standard」或「large」
  • max-video-preview:[number] - 將這個網頁所有相關影片的預覽長度限制在 [<數字>] 秒以內。指定 0 代表只顯示靜止畫面,指定 -1 代表預覽長度不限。
  • noarchive - 禁止在搜尋結果中顯示網頁的快取連結。
  • unavailable_after:[date] - 用來指定您想要 Google 停止檢索這個網頁,並且不再建立索引的時間和日期。
  • noimageindex - 禁止 Google 圖片搜尋結果將網頁顯示為圖片的參照網頁。這可以避免搜尋引擎為這個網頁中的任何圖片建立索引,但如果其他網頁中有同樣的圖片,Google 可能會以該網頁授予的權限為準而檢索這張圖片並建立索引。請注意,這項做法尚未成為網際網路標準;封鎖圖片的標準方式是使用 robots.txt 規則
  • none - 等同於 noindex, nofollow
  • all - [預設] 等同於 "index, follow"

您也可以利用「X-Robots-Tag」HTTP 標頭指令,在網頁標頭中指定這項資訊。如果您要防止 Google 為非 HTML 檔案 (例如圖檔或其他類型的文件) 建立索引,這項指令就可以派上用場。進一步瞭解 robots 中繼標記

<meta name="google" content="nositelinkssearchbox" /> 當使用者搜尋您的網站時,Google 搜尋結果有時會顯示您網站的專用搜尋框,以及導向您網站的其他直接連結。這個標記會指示 Google 不要顯示網站連結搜尋框。進一步瞭解網站連結搜尋框
<meta name="google" content="notranslate" /> 如果 Google 發現網頁內容不是使用者想要閱讀的語言,通常會在搜尋結果中提供翻譯連結。一般來說,這會讓您有更多機會將獨特且吸引人的內容,提供給更廣大的使用者族群。但是,也有可能因此遇到您不想發生的狀況。您可以使用這個中繼標記告訴 Google 不要提供這個網頁的翻譯連結。
<meta name="google" content="nopagereadaloud" /> 禁止網路瀏覽器透過「朗讀這個網頁」或「朗讀」等 Google 助理語音指令朗讀標記網頁。
<meta name="google-site-verification" content="..." /> 您可以在網站的頂層網頁中使用這個標記,向 Search Console 驗證您擁有這個網站。請注意,雖然 namecontent 的屬性值必須完全符合我們提供給您的內容 (包括大小寫),至於標記由 XHTML 改成 HTML,或者標記格式是否符合您網頁的格式,則無關緊要。
<meta http-equiv="Content-Type" content="...; charset=..." />
<meta charset="..." >
這個標記能夠定義網頁的內容類型及字元集。請務必在內容屬性值的前後加上引號,否則系統可能會以錯誤的方式解譯字元集屬性。我們建議盡量使用 Unicode/UTF-8。更多資訊
<meta http-equiv="refresh" content="...;url=..." /> 這個標記能夠在一段時間之後將使用者導向到新的網址,因此有時也被當成一種簡單的重新導向方式。不過,由於不是所有的瀏覽器都支援這個標記,所以這也可能對使用者造成困擾。W3C 不建議使用這個標記。我們建議改用伺服器端 301 重新導向。
<meta name="viewport" content="..."> 這個標記會告訴瀏覽器如何在行動裝置上轉譯網頁。如果出現這個標記,Google 就會知道該網頁適合在行動裝置上瀏覽。進一步瞭解如何設定可視區域中繼標記

<meta name="rating" content="adult" />

<meta name="rating" content="RTA-5042-1996-1400-1577-RTA" />

將網頁標為含有成人內容,表示安全搜尋結果會排除這個網頁。進一步瞭解如何標示安全搜尋網頁

其他注意事項

  • 無論網頁使用的是 HTML 或 XHTML 樣式的中繼標記,Google 均能解讀。
  • 除了 google-site-verification 以外,大小寫對中繼標記來說無關緊要。
  • 以上清單並未列出所有可用的中繼標記,如果您的網站需要使用上方沒有列出的標記,也沒有關係。唯一需要注意的是,Google 會忽略無法解讀的中繼標記。

內嵌指令

除了使用網頁層級中繼標記外,您還可以指定不要使用 HTML 網頁的哪些部分來產生網頁摘要,方法是在 spandivsection 元素上使用 data-nosnippet HTML 屬性。例如:

<p>This text can be included in a snippet <span data-nosnippet>and this part would not be shown</span>.</p>

為了確保機器可以解讀,這個部分必須是有效的 HTML 程式碼,而且所有標記都要有對應的結束標記