2023 年 9 月 Google 搜尋引擎最佳化 (SEO) 諮詢時間

這是 2023 年 9 月版本的 Google 搜尋引擎最佳化 (SEO) 諮詢時間轉錄稿。如需網站專屬說明,建議您前往 Google 搜尋中心產品討論社群發文提問。

Google 是否誤將我網站的 www 版本建立索引?

John:Wan 問,Google 誤將我網站的 www 版本建立索引,正確的網頁應該是 HTTP,然後網域名稱為 .my,網址不含 www。

Wan,您好!我們查看了您的網頁,看起來您的伺服器會自動將非 www 版本重新導向至 www 版本,並正確設定 link rel 標準元素。乍看之下,如果您是使用 Chrome 瀏覽器,看起來似乎沒有 www,但如果您在瀏覽器頂端的網址上按兩下就會展開為完整網址,其中含有 www。實際上,無論是網站的 www 版本還是非 www 版本,在 Google 搜尋中都能正常顯示。哇,我提到好多 www!

為什麼 Search Console 中篩選過的資料比整體資料還多?

Gary:Ornella 問,為什麼 Search Console 中篩選過的資料比整體資料還多?這不合理。

首先,這是個好問題。簡單來說,我們大量使用 Bloom 篩選器,因為我們需要處理巨量資料,而 Bloom 篩選器可以省下相當多的時間和儲存空間。詳細一點說明仍是我們需要處理巨量資料,因此大量運用 Bloom 篩選器,但讓我再解釋一下「Bloom 篩選器」,如果要在一個集合中處理大量項目,我是指數十億甚至數兆的項目,搜尋資料會變得非常耗時。Bloom 篩選器這時就可以派上用場,可讓您查詢另一個集合是否含有主要集合中可能項目的雜湊,然後查詢其中的資料。您會先查詢雜湊,且查詢的速度相當快,但有時候可能會有資料遺失的情況 (無論有意或無意),因此您會遇到資料缺漏的問題,而需要處理的資料越少,系統就能越準確地預測資料是否存在於主要集合。基本上,Bloom 篩選器會預測資料集中是否有內容,加快查詢的速度,但準確性不一。因此資料集越小,預測的結果就越準確。

為什麼我的 Google 協作平台網站的網頁沒有正確建立索引?

John:有人以法文提問,這基本上是詢問為何我的 Google 協作平台網站的網頁沒有正確建立索引。

很高興收到以其他語言提出的問題。退一步來說,透過 Google 協作平台建立的網站本來就會在 Google 搜尋中建立索引。不過,公開版本可能與您登入後看到的網址不同,因此 Google 協作平台中使用的網址有點難追蹤。老實說,這類網頁在技術上可以建立索引,但不適合用於搜尋引擎最佳化,而且在 Search Console 中追蹤可能較為複雜。如果您的主要考量為搜尋引擎最佳化,建議您在決定採用前,先瞭解其他選項並查看相關優缺點。如要在 Search Console 中追蹤成效,您也可以將自己的網域名稱用於 Google 協作平台網站內容。使用自己的網域名稱就能輕鬆遷移,並可讓您在 Search Console 中驗證整個網域的擁有權

Gary:Sarabjit 問,我們的網站有多個按鈕,只要點選按鈕就會擷取其他網頁的連結,Google 可以檢索這些連結嗎?

一般來說,Googlebot 不會按下按鈕。

如果我撰寫有價值的內容,「訪客貼文」(用於取得反向連結) 會違反 Google 規範嗎?

John:Brooke 問,現在大多數網站都只提供購買「訪客貼文」(用於取得反向連結) 的選項,如果我撰寫有價值的內容,這是否違反 Google 規範?

Brooke,您好,感謝您提出問題,看來您已明白。沒錯,為連結張貼訪客貼文的行為違反垃圾內容政策。請特別注意,這些連結必須符合條件,表示它們不會影響搜尋結果。您可以使用連結上的 rel=nofollowrel=sponsored 屬性來這樣做。我們可以接受透過廣告宣傳網站,但必須依前述方式封鎖連結。

電子商務類別網頁上的內容是否有助於提升整體排名?

Gary:Brooke 問,電子商務類別網頁上的內容是否有助於提升整體排名?

您可以在網頁中加入任何內容,畢竟這是您的網頁。不過,請勿在所有類別頁面上重複地加入自動產生的模糊劣質文字,這看起來很不實用,對一般人來說也是如此。如果您需要在網頁上添加內容,請新增使用者會覺得實用的內容,不要因為您需要或認為搜尋作業可能需要而加入內容。另請參考我們的電子商務建議

錯誤的語意式標記是否會造成 Google 對網站內容的瞭解有限?

John:錯誤的語意式標記是否會造成 Google 對網站內容的整體瞭解有限,進而導致難以將內容指派到分支版本?尤其是 <hr> 標記代表主題有所變動,但我可能只是基於設計目的而使用這些標記。

這是個有趣的問題。一般來說,正確使用語意式 HTML 有助於搜尋引擎進一步瞭解網頁內容和相關背景資訊。舉例來說,如果您在網頁中標記標題,明顯代表您認為內容符合該標題。這並非排名第一的秘密方式,但如果我們無法辨識文字中的意思,透過標題形式提供清楚的摘要就會有所幫助。這細微差異取決於 Google 對網頁的瞭解程度,建議您確保涵蓋所有內容。反之,HTML 從語意正確到語意有誤,也是有細微差異。搜尋引擎仍然可以瞭解您的網頁嗎?您可能無法看出 Google 解讀網頁的差異。意思突然模糊了嗎?或許您可以採用語意式結構讓意思更清楚。具體而言,以 <hr> 標記為例,我看不出來錯誤使用該標記會影響 Google 瞭解頁面。錯誤使用這個標記的方式有無數種,但網頁設計人員可能不小心誤用 <hr> 標記的影響不大。總結一句,「視情況而定」,希望這是令您滿意的回答。

在 Google Search Console 中,404 網頁的報表包含多個可能採用 JSON 或 JavaScript 的網址,我們應該忽略嗎?

Gary:Reza 問,在 Google Search Console 中,404 網頁的報表中似乎誤填了某些 JSON 或 JavaScript 程式碼的網址,我們應該忽略這些網址嗎?

您可以忽略這些網址,或直接為這類網址新增 noindex HTTP 標頭

John:Dhruv 問,Sitemap 索引檔是否能包含指向其他網域的 Sitemap 檔案連結?

Dhruv,您好,這個問題很有意思。Google 這邊的回答是或許可以,因此建議您不要採用這類設定。您可以針對不在相同網域的網址提交 Sitemap,這有兩種方式,透過 robots.txt 提交 Sitemap,或是在 Search Console 中驗證所有網域的擁有權。尤其是在分析網站時,Search Console 的擁有權可能只有細微差異,而且無法立即顯示,因此很容易忘記這個連結。如果您處理的是 Sitemap 檔案,並決定要採用這類設定,建議您在 Sitemap 檔案中新增 XML 註解,提醒自己留意這些規定,且不要在日後意外打破規定。Search Console 是 Google 專屬的服務,因此建議您也要確認其他搜尋引擎對這類設定的規定。

如何降低 Google 選擇自家網站中繼說明的可能性?

Gary:Sam Bowers 問,如何降低 Google 選擇自家網站中繼說明的可能性?

好問題。如果網頁上沒有太多內容;或相較於實際網頁內容,中繼說明與使用者查詢更相關,Google 演算法通常就會使用中繼說明。進一步瞭解說明和摘要

有方法可以指定搜尋引擎漫遊器不要檢索網頁上的特定部分嗎?

John:有人問,有方法可以指定搜尋引擎漫遊器不要檢索網頁上的特定部分嗎 (否則 Google 可以對該網頁進行檢索和建立索引)?他們還提到自己的「超級選單」中有許多重複內容,因此想要封鎖這類內容。

有方法。您可以採取一些措施防止系統為網頁的某些部分建立索引,但常見的網頁元素 (例如頁首、選單、側欄、頁尾) 則不需要禁止建立索引。搜尋引擎會依原樣處理網頁,有些網頁會有超級選單或頁尾,這些都不會有影響。針對網頁上的其他內容,您可以使用 robots.txt 禁止來源的 iframe,或是提取含有 JavaScript 的內容 (類似於由 robots.txt 禁止)。如果您只想避免在程式碼片段中顯示某些內容,建議使用 data-nosnippet 屬性。但再次提醒您,您不需要為了隱藏選單而加入這麼複雜的操作。此外,不必要的複雜度也會導致作業意外中斷,因此最好將這種情況限制在必要情況下。

您是否建議讓網頁無限捲動?自然流量或 Googlebot 會受到任何影響嗎?

Gary:Jethu 問,您是否建議讓網頁無限捲動?如果我新增這項功能,自然流量或 Googlebot 會受到任何影響嗎?

這取決於您實作無限捲動的方式。如果每個部分或虛擬網頁都能透過專屬網址存取並可供搜尋,一般來說,使用無限捲動網頁都沒問題。

John:Ryan 問,如果行動版網站顯示首頁連結,但在電腦版網站上,連結隱藏在 JavaScript 切換鈕後,且需要點選才能顯示在 HTML 中,Google 是否會降低這些網站的價值?

Ryan,您好!在行動版內容優先索引系統中,我們使用行動版網頁做為建立索引和尋找連結的基礎。如果行動版具備完整內容,就表示一切就緒。我有點訝異您的電腦版網站內容較少,不過我相信您有自己的原因。

Google 是否會為儲存至 Google 雲端硬碟中且未在其他網站代管的 PDF 檔案建立索引?

Gary:匿名者問,Google 是否會為儲存至 Google 雲端硬碟中且未在其他網站代管的 PDF 檔案建立索引?如果是,需要多久時間?

是,Google 可以為 Google 雲端硬碟代管的公開 PDF 檔案建立索引,這類檔案只是網站上的另一個網址。就像任何網址一樣,只要幾秒鐘,Google 就能為這類 PDF 檔案建立索引。

Google 如何檢索 Scrolljacking 內容?這種做法會影響使用者體驗排名嗎?

John:Matt 問,「Scrolljacking」在網路間越來越熱門。一般而言,這帶來的使用者體驗不佳。Google 會如何檢索這類內容?這種做法會影響使用者體驗排名嗎?此外,他們也在提問中加入 Scrolljacking 相關文章的連結,我們會在轉錄稿中附上連結。

Matt,您好,這個問題很有意思。我不知道這叫做 Scrolljacking,感謝您提供連結。我不認為這是不當設定,因此不會有直接影響,但您可能會看到第二層面的技術影響。舉例來說,Google 轉譯網頁時,會將網頁載入一個理論上非常大的行動裝置。如果網頁因為操弄手法的捲動事件而未顯示內容,系統可能會假設內容無法正確顯示。總而言之,我認為這可能是潛在的轉譯問題,而非品質問題。

為什麼 Google Search Console 中的 robots.txt 封鎖我的網址,但該網址仍已建立索引?

Gary:Deniz Can Aral 問,為什麼 Google Search Console 中的 robots.txt 封鎖網址,系統仍會建立索引?

這是相當常見的問題,即使已透過 robots.txt 禁止檢索網址,Google 還是能夠為網址建立索引,但只有網址而非內容。不過,Google 索引中的這類網址數量並不多,如果遭封鎖的網址在網路上獲得大量搜尋才會發生這種情況。如果您對此有任何問題,請允許檢索網址,並在 HTTP 標頭中使用 <meta> 規則或 noindex 標記

我們有垃圾 AI 內容!如何修正或從我的網站中移除這類內容?

John:Sonia 問,我們僱用了幾位內容撰寫者,但他們提供了 AI 內容,要怎麼修正這類內容?刪除 AI 內容或以新內容取代嗎?要捨棄並使用新網址建立新網站嗎?請提供建議!

這很難回答,Sonia。看來您只是盲目地發布了外部作者的內容,而未經過審查,對嗎?即使沒有 AI 內容層面的問題,這似乎也不太恰當。無論原因和來源為何,如果您在網站上發布的內容品質不佳,且不想再與該內容建立關聯,您可以移除這類內容或加以修正。建議您從大局來看,網路上是否缺少這類內容,而您的網站整體來說能為使用者帶來重要價值嗎?還是只是將網路上已存在的內容重組?或換個角度想,如果您的內容與其他網站原本已有的內容大致相同,那麼為什麼搜尋引擎應該為您的內容建立索引,甚至讓該內容在搜尋結果中的排名往前?當然,想打造出色的網站不單只是一篇好的文章,更需要有明確的策略和程序,確保每個人都能與您的目標一同邁進。

我們在一天內發現已建立索引的網址數量遽增,這是什麼原因?

Gary:Lorenzo 問,我們在某天內突然大幅增加已建立索引的網址,這是什麼原因?

我們可能取得更多硬碟,或釋出一些空間,也可能是因為我們才剛找到這些新網址。這很難判斷。不管怎麼樣都值得高興,就好好慶祝吧!

Google 是否允許在一個網站小圖示檔案中使用多種檔案尺寸?

John:Dave 問,Google 是否允許在一個網站小圖示檔案中使用多種檔案尺寸?Google 是否可以理解以尺寸屬性標記的多個圖示,並挑選適當的圖示?

Dave,您好。就技術方面來說,.ico 檔案格式可讓您以多種解析度提供檔案。但是,基於各種目的出現越來越多種尺寸,通常個別指定尺寸和檔案會比較適當。Google 支援在 HTML 中使用多種網站小圖示尺寸,因此如果您想提供特定尺寸也沒問題。

如果網站的某些部分採用不同 CMS,Google 是否會以不同方式判斷?

Gary:Vvienne 問,如果網站有多個 CMS,Google 是否會以不同的方式判斷?

不會。

在 Google 搜尋中,我們的網站會將 PDF 下載頁面顯示為主要頁面,系統可以變更搜尋結果嗎?

John:Anna 問,我們基金會網站的 Google 搜尋結果需要重新檢索,該網站會將 PDF 下載頁面顯示為主要頁面。我們的網站是荷蘭人權基金會,系統可以變更搜尋結果嗎?

Anna,您好,我查看了您的網站,系統顯示其他頁面,而非您的首頁,這是因為該頁面含有 noindex robots <meta> 標記。這個 <meta> 標記會禁止系統為該頁面建立索引,移除後應該很快就會恢復正常。

在 Google 搜尋上搜尋我的網站時,第一筆搜尋結果是產品頁面,而不是我的歡迎頁面。為什麼?

John:Julien 問,在 Google 搜尋上搜尋我的網站時,第一個結果是產品頁面,而不是我的歡迎頁面。為什麼會這樣?產品頁面甚至還沒準備好搜尋引擎最佳化,但我的歡迎頁面已準備就緒。

Julien 您好,Google 會參考各種因素,針對特定查詢,嘗試找出與使用者最相關的網頁。在資訊檢索中,其中一個概念是以感知的使用者意圖為基礎。簡單來說,使用者搜尋這個字詞時的目的為何?他們是想進一步瞭解產品或公司嗎?還是想立即購買產品嗎?同樣的查詢也可能會隨著時間改變。簡而言之,這表示即使網頁尚未準備好搜尋引擎最佳化,但如果當下系統認為該網頁與查詢相關,可能還是會顯示在搜尋結果中。從實務上來看,建議您瞭解使用者可能透過哪些不同方式前往您的網站,並嘗試適當涵蓋使用者的需求,這樣無論使用者從哪裡瀏覽網站,都能享有良好的使用體驗。

我收到有關改善 INP 問題的 Search Console 快訊。這項資料是如何計算得出?最容易的修正方式為何?

John:Alejandro 問,John 和 Google 團隊,您們好。我今天收到有關改善 INP 問題的 Search Console 快訊。這項資料是如何計算得出?最容易的修正方式為何?

我們無法在這裡提供完整回答,但您可以在 web.dev 網站找到 Interaction to Next Paint (INP) 的相關說明文件。如果您有意改善網站的分數,建議先查看上述文件。請注意,INP 尚未納入 Core Web Vitals,而且 Core Web Vitals 只是網頁體驗實用內容系統中的眾多指標之一。改善 INP 絕對有助於改善使用者體驗,但不要期望搜尋排名會有明顯改變。

如何將 3 萬個網址從 Google Search Console 中移除,避免受到日本關鍵字駭客攻擊?

John:Heather 問,如何將 3 萬個網址從 GSC 中移除,避免受到日本關鍵字駭客攻擊?

Heather,您好。得知您遭到駭客入侵,我們深感抱歉。希望您在這段期間能解決這個問題,web.dev 上也有這類駭客攻擊的內容,我會在轉錄稿中附上連結。請注意,這類駭客攻擊往往向 Google 偽裝遭入侵的內容,因此您可能需要一些協助,仔細確認這類內容已完全移除。對於搜尋結果而言,由於搜尋結果涵蓋的網頁數量較多,建議您著重於曝光率較高的網頁,然後移除重新建立索引,藉此手動移除這些網頁,其餘頁面會自動刪除。如果您已明確找出遭入侵的內容,您還是可以在一段時間內找到這些內容,但一般使用者也會尋找您的網站,因此我們的目標應該是確保這些搜尋結果沒有問題。

透過 Search Console 為我的網頁申請建立索引後,為什麼 Google 取消建立索引?我已經執行這項操作很多次了。

John:Grace 問,透過 Search Console 為我的網頁申請建立索引後,為什麼 Google 取消建立索引?我已經執行這項操作很多次了。

Grace 您好,我不清楚相關網頁的內容,因此無法確定原因。但對我來說,這可能表示我們的系統不太清楚您網站及其內容的價值。我們幾乎從未為某個網站的所有網頁建立索引,所以這也是正常現象。您或許可以針對建立索引推送一次,但我們的系統會在一段時間後重新評估內容和網站,並可能會再次捨棄這些網頁。最好的行動是不要一直嘗試推送這些網頁,而是要讓我們的系統充分瞭解網站的整體品質、為網路帶來的獨特價值,以及與使用者實際查詢的相符程度,然後我們就會自行建立索引。