Google 搜尋排名系統指南
Google 採用的自動化排名系統會檢視搜尋索引中數千億個網頁和其他內容,考量相關因素和信號,藉此顯示最相關的實用結果,而且一切都在轉瞬之間完成。
我們會定期進行嚴格測試和評估以改善這些系統,如果有對於內容創作者和其他使用者有用的更新,我們會提供排名系統更新通知。
本頁指南可協助您瞭解我們的一些重要排名系統。其中涵蓋了核心排名系統中的部分系統,這些系統是 Google 回應使用者查詢產生搜尋結果的基礎技術。其中也包含與特定排名需求相關的一些系統。
您也可以前往 Google 搜尋的運作方式網站,瞭解排名系統與其他程序如何搭配運作,讓 Google 搜尋能達成我們的使命:彙整全球資訊,讓全世界都能使用,人人受惠。
BERT
基於轉換器的雙向編碼器表示法 (BERT) 是 Google 的 AI 系統,用來讓我們瞭解字詞組合如何表達不同的意義和意圖。
災害資訊系統
Google 開發了相關系統,以便在災害發生期間提供即時且實用的資訊,無論是涉及個人危機處境、天災或其他廣泛的危機情境都包含在內:
- 個人危機:我們的系統會針對自殺、性侵、服毒、性別暴力或藥物成癮行為相關查詢,設法在使用者搜尋個人危機處境相關資訊時,顯示可靠機構的救助專線和內容。進一步瞭解個人危機資訊在 Google 搜尋中的顯示方式。
- SOS 警報:在天災或廣泛的危機情境下,SOS 警報系統會設法顯示當地、國家或國際主管機關提供的最新資訊。這類資訊包括緊急電話號碼和網站、地圖、實用詞組翻譯、捐款管道等等。進一步瞭解 SOS 警報的運作方式,以及 SOS 警報在 Google 災害警示系統中如何發揮作用,在洪水、野火、地震、颶風和其他災害發生期間提供協助。
簡化系統
當使用者在 Google 上搜尋時,可能會找到數千甚至數百萬個相符的網頁。其中有些網頁可能非常相似。在這種情況下,系統只會顯示最相關的搜尋結果,以避免不必要的資料重複。進一步瞭解簡化功能的運作方式,以及在系統簡化搜尋結果的情況下,如何因應需求查看省略的項目。
精選摘要也會執行簡化功能。 如果系統將網頁資訊整理為精選摘要,我們就不會在搜尋結果的第一頁重複顯示該項資訊。這種做法不僅將結果去無存菁,也讓使用者更容易找到相關資訊。
完全比對網域系統
我們的排名系統會將網域名稱中的字詞視為考量因素之一,用來判斷內容是否與搜尋相關。不過,有些網域本身的設計就是為了與特定查詢達成完全比對,因此我們的完全比對網域系統會避免賦予這類網域中的內容過多重要性。舉例來說,可能有人會建立含有「best-places-to-eat-lunch」字詞的網域名稱,希望網域名稱中的所有字詞都能促使網頁內容取得較高排名。我們的系統會針對這種情形進行調整。
時效性系統
我們有各種「查詢時效性」系統,在查詢內容有時效性需求時,能為使用者顯示較新的內容。舉例來說,如果使用者搜尋的是新上映的電影,他們可能想找的是最近的評論,而不是影片製作期間的舊文章。再舉個例子,一般情況下,搜尋「地震」可能會找到的是防災資訊和地震相關資源。然而,如果最近剛發生地震,系統可能會顯示新聞報導和較新的內容。
連結分析系統和 PageRank
我們設有多種系統,用來瞭解網頁之間如何彼此連結,藉此判斷網頁內容是什麼,並找出對該筆查詢而言最實用的回應。PageRank 就是其中之一,這是 Google 剛開始推出時採用的一種核心排名系統。如要瞭解詳情,歡迎閱讀原始的 PageRank 研究論文和專利。從那時起,PageRank 的運作方式已經大幅進化,至今仍為我們核心排名系統的一員。
當地新聞系統
我們有各種系統能找出相關的當地新聞來源並向使用者顯示,例如透過「焦點新聞」和「地方新聞」功能。
MUM
多任務統一模型 (MUM) 是一種 AI 系統,可以理解並產生語言。目前並未將這套系統運用於一般搜尋排名,只用在某些特定用途,例如改善 COVID-19 疫苗資訊的搜尋結果,以及改善系統顯示的精選摘要。
神經比對
神經比對是一種 AI 系統,Google 會用來解讀查詢和網頁中概念的表示法,並且將兩者互相比對。
原創內容系統
我們有些系統是用來確保在搜尋結果中,原創內容 (包括原創報導) 會放在顯眼位置,而引用原創內容的項目則放在較後方。其中包含支援特殊的標準標記,讓創作者可以用這種標記協助我們深入瞭解何者是主要網頁 (如果有好幾個重複網頁在不同地方)。
考量移除情形的排名調降系統
Google 可以根據自家政策移除特定類型的內容。如果我們針對特定網站大量執行這類移除作業,會將這種情況當做用來改善結果的信號。我們特別建議您採取以下做法:
- 依法移除內容: 如果我們頻繁收到有關特定網站的有效版權移除要求,便可根據這些要求在搜尋結果中降低該網站其他內容的排名。這麼一來,如果網站上還有其他侵權內容,使用者就比較不會接觸到這些內容 (與原始內容相較)。我們也會對其他申訴類型採取類似的調降排名信號,包括誹謗、仿冒商品和法院命令移除的相關申訴。如果辨識出兒少性虐待內容,我們一律會加以移除,而且如果網站中含有高比例的兒少性虐待內容內容,我們會降低網站中所有內容的排名。
- 移除個人資訊: If we process a high volume of personal information removals involving a site with exploitative removal practices, we demote other content from the site in our results. We also look to see if the same pattern of behavior is happening with other sites and, if so, apply demotions to content on those sites. We may apply similar demotion practices for sites that receive a high volume of removals of content involving doxxing content, explicit personal imagery created or shared without consent, or explicit non-consensual fake content.
段落排名系統
段落排名是一種 AI 系統,作用是識別網頁的個別部分或「段落」,以便進一步瞭解網頁與搜尋的關聯性。
RankBrain
RankBrain 是一套 AI 系統,可協助我們瞭解字詞與概念之間的關係。換句話說,即使內容不含搜尋中使用的所有確切字詞,系統也能設法瞭解與內容相關的其他字詞與概念,藉此傳回相關的內容。
可靠資訊系統
多種系統以不同的方式搭配運作,盡可能顯示最可靠的資訊,例如協助呈現更多具公信力的網頁,降低劣質內容的排名,並提升優質新聞排名。如果缺少可靠的資訊,或者系統對於搜尋取得的結果整體品質不太有把握,我們的系統會針對瞬息萬變的主題自動顯示內容警示。這些資訊可協助您找出其他搜尋方式,或許能搜尋到更實用的結果。進一步瞭解我們在 Google 搜尋中提供優質資訊的方法。
評論系統
評論系統的目的在於進一步獎勵優質的評論,也就是由熟悉相關主題的專家或愛好者所撰寫,而且含有深入分析資訊和原創研究結果的內容。
網站多元性系統
在我們的網站多元性系統運作之下,通常在熱門搜尋結果中,來自同一網站的網頁資訊不會超過兩筆,這樣一來就沒有任何單一網站會占據整個熱門搜尋結果。不過,要是系統判定該網站對於特定搜尋高度相關,我們仍會顯示兩則以上的網頁資訊。網站多元性通常會將子網域視為根網域的一部分。I也就是說,系統會將來自子網域 (subdomain.example.com) 和根網域 (example.com) 的網頁資訊全部視為同一個網站。不過有時候,如果系統認為有必要,也會基於多元性的目的,將子網域視為獨立網站。
垃圾內容偵測系統
沒有人希望電子郵件收件匣裡充斥垃圾郵件,因此垃圾郵件篩選器十分有用。 Google 搜尋也面臨類似的挑戰,因為網際網路含有大量垃圾內容,如果未能處理,我們就無法顯示最實用且相關的搜尋結果。我們採用多種垃圾內容偵測系統 (包括 SpamBrain) 來處理違反垃圾內容政策的內容和行為。我們會持續更新這些系統,以因應垃圾內容干擾網路的最新方式。
已淘汰系統
以下系統說明僅供留存記錄。這些系統已整合至後續系統,或是融入我們的核心排名系統。
實用內容系統
我們在 2022 年宣布推出「實用內容更新」,這個系統的設計目的是要更充分確保使用者在搜尋結果中看到由真人寫給使用者閱讀的實用原創內容,而不是主要為了爭取搜尋引擎流量而製作的內容。在 2024 年 3 月,這個系統演變為核心排名系統的一部分,因為我們的系統會運用各種信號和系統向使用者顯示實用的結果。
Hummingbird
這是 2013 年 8 月為整體排名系統帶來重大改善的項目。在那時之前或之後,我們的排名系統都一直在進化。
Panda 系統
這個系統的設計目標,是要進一步確保優質原創內容能顯示在搜尋結果中。此系統於 2011 年推出,暱稱為「Panda」,後來在 2015 年演變為核心排名系統的一部分。
Penguin 系統
這個系統的作用是打擊垃圾連結。此系統於 2012 年推出,暱稱為「Penguin 更新」,2016 年整合至核心排名系統中。