詳盡指南:Google 搜尋的運作方式

Google 是全自動化的搜尋引擎,會運用一種稱為「網路檢索器」的軟體定期探索網路,找出能加入索引的網頁。實際上,我們搜尋結果列出的大多數網頁都不是由人為提交,而是網路檢索器在探索網路時找到,然後自動加入搜尋結果。本文件說明 Google 搜尋在您網站中運作的各個階段。掌握這項基本知識有助於修正檢索問題、讓網頁編入索引,以及瞭解如何最佳化網站在 Google 搜尋中的呈現方式。

開始前的注意事項

深入瞭解 Google 搜尋的運作方式之前,請務必注意,Google 不接受以付費的方式增加檢索某網站的頻率或提高其排名。如果有人告訴您可以這樣做,請注意這並非事實。

即使您的網頁符合 Google 搜尋基礎入門的做法,Google 也無法保證一定會檢索您的網頁、建立索引或提供網頁。

Google 搜尋分為三個階段運作,並非所有網頁都會經歷各個階段:

  1. 檢索:Google 會透過稱為檢索器的自動化程式,從網際網路上找到的網頁下載文字、圖片和影片。
  2. 建立索引:Google 會分析網頁上的文字、圖片和影片檔案,並將相關資訊儲存在 Google 索引中 (Google 索引是一個大型資料庫)。
  3. 提供搜尋結果:當使用者利用 Google 搜尋資訊時,Google 會傳回與使用者查詢內容相關的資訊。

檢索

第一個階段是找出網路上有哪些網頁。由於世界上並沒有統一登錄網頁的地方,因此 Google 必須持續尋找新網頁,並將這些網頁加入已知網頁清單,這項程序稱為「網址搜尋」。清單中都是 Google 造訪過的網頁。Google 會追蹤已知網頁的連結並連到新網頁,以此發現其他未知的網頁,例如類別網頁這種中心頁面,會連結到新的網誌文章。此外,當您提交網頁清單 (Sitemap) 供 Google 檢索時,我們也會找到其他網頁。

Google 找到網頁網址後,可能會造訪 (或「檢索」) 該網頁,瞭解網頁內容。我們使用大量電腦來檢索網路上數十億的網頁。用來擷取網頁的程式名為 Googlebot,又稱為檢索器、漫遊器或自動尋檢程式。Googlebot 會使用特定的演算程序來決定要檢索的網站、檢索頻率,以及要從每個網站擷取的網頁數量。此外,Google 檢索器也經過設計,會避免檢索網站速度過快,以免網站超載。此機制是根據網站的回應 (例如 HTTP 500 錯誤表示「放慢」) 和 Search Console 中的設定

但是,Googlebot 不會檢索所有找到的網頁。網站擁有者可能會禁止 Googlebot 檢索部分網頁,有些網頁則需要登入才能存取。

在檢索期間,Google 會轉譯網頁,並使用最新版本的 Chrome 執行找到的任何 JavaScript,這與瀏覽器轉譯您造訪的網頁類似。轉譯作業非常重要,因為網站通常會利用 JavaScript 將內容投放到網頁,而如果沒有經過轉譯,Google 可能無法看到這類內容。

檢索作業取決於 Google 檢索器是否能存取網站,以下列舉 Googlebot 存取網站碰到的部分常見問題:

建立索引

網頁經過檢索之後,Google 會嘗試解讀網頁內容,這個階段稱為「索引」,其中包括處理及分析文字內容和關鍵內容標記和屬性,例如 <title> 元素和 alt 屬性、圖片影片等等。

在建立索引的過程中,Google 會判斷網頁是否是網際網路上其他網頁的重複版本或標準網頁。 標準網頁是指可能出現在搜尋結果中的網頁,為了選取標準網頁,我們首先會將網際網路上存在類似內容的網頁分為一組 (又稱為分群法),然後再選取其中最具代表性的網頁。群組中的其他網頁是在不同情境下提供的替代版本,例如使用者透過行動裝置進行搜尋,或是使用者在尋找網頁叢集中的特定網頁。

此外,Google 也會收集標準網頁及其內容的相關信號,以便在下個階段用於在搜尋結果中提供網頁。例如網頁的語言、內容所在國家/地區、網頁可用性等等,都屬於這類信號。

系統收集到的標準網頁及其叢集相關資訊可能會儲存在 Google 索引中,這是由數千台電腦代管的大型資料庫。我們不保證一定會建立索引;並非 Google 處理過的每個網頁都會建立索引。

索引也會取決於網頁內容及其中繼資料。常見的索引問題包括:

提供搜尋結果

使用者輸入查詢字詞時,我們的系統會搜尋索引資料庫,並找出符合的網頁,再傳回我們認為與使用者的查詢內容最相關且品質最佳的結果。關聯性取決於數百種因素,使用者的所在位置、語言和裝置 (電腦或手機) 等資訊都可能包含在內。舉例來說,位於巴黎和香港的使用者搜尋「單車維修店」時看到的結果就不一樣。

根據使用者的查詢,搜尋結果網頁所顯示的搜尋功能也會有所變動。舉例來說,搜尋「單車維修店」時,系統可能會顯示本地搜尋結果,而且不會顯示圖片搜尋結果;不過,如果搜尋「現代單車」,則較有可能顯示圖片搜尋結果,但不太可能顯示本地搜尋結果。您可以前往視覺元素庫,瀏覽 Google 網頁搜尋中最常見的 UI 元素。

Search Console 可能會告知您網頁已建立索引,但不會顯示在搜尋結果中。可能原因如下:

雖然本指南說明了 Google 搜尋的運作方式,但我們會不斷改進演算法。 您可以追蹤 Google 搜尋中心網誌,隨時掌握這些變更。