提升搜尋品質

搜尋品質是指排名依據的搜尋結果品質 以及使用者所察覺的印象。

「排名」是指項目的順序,「喚回度」則是指 已擷取相關項目。項目 (也稱為文件) 是指 是供 Google Cloud Search 建立索引的數位內容。項目類型 包含 Microsoft Office 文件、PDF 檔案、資料庫中的資料列,不重複的 網址等等。項目包含:

  • 結構化中繼資料
  • 可建立索引的內容
  • 存取控制清單 (ACL)

Cloud Search 會使用各種信號來擷取搜尋查詢並進行排名 ;查看搜尋查詢產生的項目。您可以調整 Cloud Search 透過結構定義中的設定 (項目內容) 來發出信號 和中繼資料 (在建立索引期間) 和搜尋應用程式。我們為了 文件旨在協助您修改 信號影響者

如需建議和選用設定的摘要,請參閱: 建議和選用搜尋品質設定的摘要

影響主題性分數

主題是指搜尋結果與原始查詢的關聯性 條款。項目的主題是根據下列條件計算得出:

  • 每個查詢字詞的重要性。
  • 命中的次數 (特定查詢字詞出現在項目的 或中繼資料)。
  • 符合查詢字詞的類型及其子類,具有一項商品 已經編入 Cloud Search 索引

如要影響文字屬性的主題性分數 定義 RetrievalImportance 。與具有高評價的房源比對相符 「RetrievalImportance」的分數高於一符合 RetrievalImportance 為低數值。

舉例來說,假設您有一個資料來源具有下列特性:

  • 這個資料來源用於儲存軟體錯誤記錄。
  • 每個錯誤都有名稱、說明和優先順序。

多數使用者會使用錯誤名稱查詢這個資料來源,因此您應 在結構定義中,將名稱上的 RetrievalImportance 設為 HIGHEST

反過來說,大部分使用者都無法使用 因此,請將說明上的 RetrievalImportance 設為 DEFAULT。 以下是含有 RetrievalImportance 設定的結構定義範例。

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

如果是 HTML 文件,則請使用 <title><h1> 等標記,以及 字型大小和粗體等格式設定設定 代表不同字詞的重要性如果 ContentFormat敬上 是 TEXTItemContent 具有 DEFAULT 的擷取重要性,如果採用 HTML,則擷取重要性 取決於 HTML 屬性。

影響即時性

更新間隔會評估項目在最近修改與判斷的時間 回應中的 createTimeupdateTime 屬性 ItemMetadata。 較舊的項目會在搜尋結果中的排名降低。

您可以調整 freshnessPropertyfreshnessDuration FreshnessOptions敬上 在結構定義中

freshnessProperty 可讓您使用日期或時間戳記屬性: 計算更新間隔,而非預設的 updateTime

以上述軟體錯誤追蹤系統的例子中,截止日可能會 做為 freshnessProperty,因此到期日最接近 將這一天視為「更安全」,可提高排名。追蹤對象為 包含 freshnessProperty 設定的範例結構定義:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

使用 freshnessDuration 識別系統如何判定某項商品過舊。 舉例來說,您的資料來源可能沒有定期建立索引,或為 您不希望新鮮度影響排名您可以達成 為目標,為 freshnessDuration 指定高價值。

假設您有一個內含員工設定檔資訊的資料來源。在本 ,則您需要較高的 freshnessDuration,因為員工會改變 資訊通常與員工排名無關。追蹤對象為 包含 freshnessDuration 設定的範例結構定義:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

您也可以將 freshnessDuration 設為資料來源的極小值 內容經常變動,例如包含新聞報導的資料來源。 在這種情況下,最近建立或修改的文件最相關的文件。 以下是含有資料 freshnessDuration 設定的範例結構定義 含有快速變動內容的來源:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

影響品質

品質是評估項目準確度和實用性的衡量標準, 一個項目一個資料來源可包含多個語意類似的文件, 品質不同您可以指定介於 0 至 0 之間的品質值 1 使用 SearchQualityMetadata。 相較於價格較低的商品,價值較高的商品會獲得更高的排名 輕鬆分配獎金只有在您需要影響或提升 項目。

舉例來說,假設您有一個內含員工福利的資料來源 文件。您可以利用 SearchQualityMetadata,提升 人力資源部門員工所撰寫的文件,包含其他使用者所編寫的文件 員工人數。

以下是含有以下項目的 SearchQualityMetadata 範例結構定義: 錯誤追蹤系統中的問題:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

根據這個架構,當使用者使用「問題」這個搜尋字詞進行搜尋時,問題 3 結構定義 (品質 1) 的排名高於問題 2 (品質為 0 .5) 與問題 1 (如未指定,則預設品質為 0)。

使用欄位類型的影響

Cloud Search 可讓您根據列舉或列舉值影響排名 整數屬性。針對每個整數或列舉屬性, OrderedRanking敬上 可以指定這項設定包含下列值:

  • NO_ORDER (預設):屬性不會影響排名。
  • ASCENDING:這個整數或列舉屬性值較高的項目 相較於價值較低的商品,可獲得更高的排名。
  • DESCENDING:整數或列舉屬性值較低的項目 相較於價值較高的商品,排名也有所提升

舉例來說,假設錯誤追蹤系統中的每個錯誤都有 將錯誤的優先順序儲存為 HIGH (1)、MEDIUM (2) 或 LOW (3)。在此情境中,如果將 OrderedRanking 設為 DESCENDING,即可提供 與 LOW 項優先錯誤相比,多項優先錯誤的排名提高了 HIGH。 以下是含有 OrderedRanking 設定問題的結構定義範例, 錯誤追蹤系統:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

錯誤追蹤系統也可能有一個名為 votes 的整數屬性,用於 向使用者收集關於錯誤相對重要性的意見回饋。您可以運用 votes 屬性,藉由提供更多重要性 票數最多的錯誤在這種情況下,您可以指定 OrderedRanking敬上 做為 votes 屬性的 ASCENDING,這樣票數最多的問題 有助於提高排名以下是含有 OrderedRanking 的結構定義範例 錯誤追蹤系統中的問題設定:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

透過查詢擴展影響排名

查詢擴充是指使用同義詞和 拼字,取得更精確的結果。

使用同義詞影響搜尋結果

Cloud Search 會運用公開網路內容推斷出的同義詞,藉此擴大 查詢字詞。您也能定義要擷取的自訂同義詞 組織專用術語,例如 機構或產業專用的術語

自訂同義詞可在資料來源內定義,或做為個別資料定義 來源。根據預設,同義詞會套用至所有搜尋的所有資料來源 應用程式。不過,您可以按照資料來源和 搜尋應用程式如要瞭解如何定義自訂同義詞,包括 分組方式,請參閱 定義同義詞

使用拼字影響搜尋結果

Cloud Search 會根據 公開的 Google 搜尋資料。如果 Cloud Search 在結構定義中偵測到拼字錯誤 就會傳回建議查詢的 SpellResult。 系統可能會將建議拼法顯示為使用者建議。適用對象 比方說,使用者可能會拼錯「employe」這個查詢字詞 「您是不是要查嗎?」建議

Cloud Search 也會使用拼字校正做為同義詞,協助擷取文件 且可能因為拼字錯誤而錯過。

透過搜尋應用程式設定影響排名

Google Cloud Search 簡介:搜尋 應用程式是一組設定,可與搜尋建立關聯 介面,提供與搜尋有關的內容資訊。下列 設定可讓您透過搜尋應用程式影響排名:

  • 評分設定
  • 來源設定

以下兩個章節將說明這些設定在哪些 影響排名

調整評分設定

您可以為每個搜尋應用程式指定 ScoringConfig ,用於控制在排名期間部分信號的應用。目前, 即可停用更新個人化功能。

如果停用間隔,清單中所列的所有資料來源就會停用 搜尋應用程式,無論結構定義中指定的更新間隔選項為何。 資料來源同樣地,如果停用個人化設定,owner 提升及互動提升不會影響排名。

如需設定此設定的逐步說明,請參閱 自訂 Cloud Search 搜尋體驗

調整來源設定

來源設定允許您指定資料來源層級的設定 搜尋應用程式支援的設定如下:

  • 來源重要性
  • 聚集

設定來源重要性

「來源重要性」是指資料來源在 搜尋應用程式你可以在「SourceImportance」欄位中指定這項設定 內部 SourceScoringConfig。 資料來源中具有 HIGH 重要性的項目在排名上會有所提升 與資料來源含有 DEFAULTLOW 來源的項目比較 重要性。如果您認為使用者會造訪您的網站,可透過這項設定影響排名 偏好來自特定資料來源的結果

舉例來說,假設您有一個產品支援入口網站,其中包含外部和 內部疑難排解資料。在此情境下,建議您設定 搜尋應用程式,以優先處理內部資料來源的結果。

如需設定此設定的逐步說明,請參閱 自訂 Cloud Search 搜尋體驗

設定擁擠程度

控制是指從單一表格 某些資料來源。這個值 也可以使用 numResults 欄位 SourceCrowdingConfig。 這個值預設為 3,表示如果資料顯示 3 筆結果 來源 Cloud Search 會開始顯示其他資料來源的搜尋結果。項目數 只有在所有資料來源都含有 已達上限,或者其他資料沒有其他結果 資料來源

這項設定有助於確保搜尋結果的多樣性, 以防止某個資料來源佔據搜尋結果網頁

如需設定此設定的逐步說明,請參閱 自訂 Cloud Search 搜尋體驗

透過個人化功能影響排名

個人化是指顯示個人化搜尋結果的方式 根據存取結果的個別使用者進行設定您可以影響排名 ,根據以下條件決定項目優先順序:

  • 項目擁有權
  • 商品互動
  • 使用者點擊次數
  • 項目語言

以下三節將說明如何根據分析結果 這些條件。

依據商品擁有權決定排名

項目擁有權是指針對使用者擁有的項目提升排名 系統就會執行搜尋查詢每個項目都有 ItemAcl敬上 具有 owners 欄位若執行查詢的使用者是項目的擁有者 那麼該商品預設會獲得較高的排名您可以在 關閉搜尋應用程式的個人化功能。

根據商品互動提升排名

項目互動是指提升搜尋項目的排名。 使用者互動 (查看、加註、編輯等) 的查詢。

系統會自動為 Google Workspace 取得項目互動信號 其他 Google Cloud 產品,如雲端硬碟和 Gmail至於其他產品,你可以提供商品層級 互動 這些資料,包括互動類型 (檢視、編輯)、 使用者與主體 (曾與項目互動的使用者) 互動。請注意, 具有近期互動次數的項目可獲得更高的排名。

根據使用者點擊次數提升排名

Cloud Search 會收集目前搜尋結果的點擊次數,並用來 增加先前透過 相同使用者

透過查詢解讀影響排名

Cloud Search 的查詢解釋功能會自動解讀 在使用者查詢中嵌入運算子和篩選器,並將這些元素轉換成 結構化的結構化查詢查詢解讀使用定義的運算子 結合已建立索引的文件,推斷使用者的 定義。這項功能可讓使用者輕鬆搜尋 但仍可取得精確的結果詳情請參閱 為最佳查詢解讀結構建立結構定義

依項目語言提升排名

「語言」是指讓語言排名降低的項目排名降低 不符合查詢的語言。以下因素會影響 根據語言顯示項目:

  • 查詢語言。系統自動偵測的搜尋查詢語言 languageCode 中指定的 RequestOptions

    如果您建立自訂搜尋介面,應將 languageCode 設為 使用者的介面語言或語言偏好設定 (例如 網路瀏覽器或搜尋介面網頁)。自動偵測的查詢 語言的優先順序高於 languageCode,因此搜尋品質不會 當使用者以不同語言輸入查詢時遭到入侵, 存取 API

  • 項目語言。在索引時,ItemMetadata 中設定的 contentLanguage 或是 Cloud Search 自動偵測的內容語言。

    文件的 contentLanguage 在索引時留空,且 將ItemContent填入資料,Cloud Search 會嘗試偵測語言 儲存在 ItemContent 中,並將其儲存在內部自動偵測 語言未加入 contentLanguage 欄位。

如果查詢內容和項目的語言相符,系統就不會套用語言降低排名。如果 這兩個設定不相符 ,即表示該項目的排名降低。語言排名降低 已套用至「contentLanguage」為空白且 Cloud Search 無法 自動偵測語言。因此,文件的排名不會 在 Cloud Search 無法偵測語言的情況下,會受到影響。

根據項目情境提升排名

您可以提高與背景資訊更相關的項目排名。 即可。背景介紹 (contextAttributes)。 是您可以在建立索引期間指定的一組已命名屬性, 搜尋要求) 提供特定搜尋查詢的背景資訊。

例如,假設有一項項目 (如員工福利文件) 在 LocationDepartment 的內容相關,例如城市 (San Francisco)、州/省 (California)、國家/地區 (USA) 和Department (Engineering)。在此情況下,您可以用下列指示為項目建立索引 具名屬性:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

使用者輸入「福利」的搜尋查詢時搜尋介面 可能包含使用者的位置資訊及部門 請求。例如,以下搜尋要求包含地點和部門 有關芝加哥工程師的資訊:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

因為已建立索引的項目和搜尋要求都含有 &quot;Department=Engineering&quot;和「Location=USA」已建立索引的項目 (員工 優勢文件)。

現在,假設另一位印度工程師輸入了「 「福利」然後搜尋到搜尋介面以下搜尋要求 位置及部門資訊:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

由於已建立索引的項目和搜尋要求「只會」包含 屬性是「Department=工程部門」已編入索引的項目只會稍微出現在 搜尋結果排名較高 (與第一筆搜尋查詢相比) 「福利」由美國芝加哥伊利諾州的工程師輸入)。

以下是提高排名的一些情境範例:

  • 位置:項目可以與特定地區的使用者有關,例如建築物、城市、國家/地區或區域。
  • 職務角色:項目可以與特定工作角色的使用者更相關,例如技術文件寫入者或工程師。
  • 部門:項目大小可能與某些部門有關聯性,例如銷售或行銷。
  • 工作等級:項目關聯性,可以針對特定工作等級提供,例如董事或執行長。
  • 員工類型:項目可能與特定類型的員工有關聯性,例如兼職和全職員工。
  • 資歷:項目可能與員工的資歷更相關,例如新進員工。

根據商品熱門程度影響排名

Cloud Search 提升熱門項目的排名。從近期搜尋查詢中獲得點擊次數的項目增加。

透過點閱率影響排名

Cloud Search 會收集目前搜尋結果的點擊次數,並利用特定搜尋查詢提高熱門項目的排名,提升日後搜尋結果的排名。

搜尋品質設定的摘要 (建議和選用)

下表列出所有建議和選用的搜尋品質 可以管理叢集設定,像是節點 資源調度、安全性和其他預先設定項目這些建議應該能協助您 Cloud Search 的排名模型。

設定位置建議/選用詳細資料
結構定義設定
ItemContent 欄位ItemContent推薦建立或更新結構定義時,填入項目的非結構化內容。這個欄位用於產生摘要。
RetrievalImportance 欄位RetrievalImportance推薦建立或更新結構定義時,請為明顯重要或主題明確的文字屬性設定。
FreshnessOptionsFreshnessOptions選用建立或更新結構定義時,請設定確保項目不會因資料有誤或缺少資料而降低排名。
索引設定
createTime/updateTimeItemMetadata推薦在建立項目索引時填入資料。
contentLanguageItemMetadata推薦在建立項目索引時填入資料。如未列出,Cloud Search 會嘗試偵測 ItemContent 使用的語言。
owners 欄位ItemAcl()推薦在建立項目索引時填入資料。
自訂同義詞_dictionaryEntry 結構定義推薦在索引層級定義資料來源層級或做為個別資料來源。
quality 欄位SearchQualityMetadata選用如要提高基本品質升幅 (與其他語意相似的項目相比),請在建立索引時設定品質。為資料來源中的所有項目設定這個欄位,會使其效果失效。
商品層級互動資料interaction選用如果資料來源記錄了使用者互動情形,並提供使用者互動的存取權,請在建立索引期間填入每個項目的互動資料。
整數/列舉屬性OrderedRanking選用項目順序涉及相關項目時,請在建立索引時指定整數和列舉屬性的排序排名。
搜尋應用程式設定
Personalization=falseScoringConfig 或使用 Cloud Search 管理員 UI推薦建立或更新搜尋應用程式時。請務必按照「透過個人化功能影響排名」的說明,提供正確的擁有者資訊
SourceImportance 欄位SourceCrowdingConfig選用如要自訂調整特定資料來源的結果,請設定這個欄位。
numResults 欄位SourceCrowdingConfig選用如要控制結果的多樣性,請設定這個欄位。

後續步驟

以下是您可能採取的後續步驟:

  1. 為最佳查詢解讀結構建立結構定義

  2. 瞭解如何運用 要定義的 _dictionaryEntry 結構定義 貴公司常用字詞的同義詞。如要使用 _dictionaryEntry敬上 結構定義,參照 定義同義詞