本頁面由 Cloud Translation API 翻譯而成。

建立內容連接器

內容連接器是用來遍歷企業存放區中的資料，並填入資料來源的軟體程式。Google 提供下列選項，協助開發內容連接器：

內容連接器 SDK。如果您使用 Java 程式設計，這是不錯的選擇。Content Connector SDK 是 REST API 的包裝函式，可讓您快速建立連接器。如要使用 SDK 建立內容連接器，請參閱「使用 Content Connector SDK 建立內容連接器」。
低階 REST API 或 API 程式庫。如果您並未使用 Java 進行程式設計，或是程式碼集更適合使用 REST API 或程式庫，請使用這些選項。如要使用 REST API 建立內容連接器，請參閱「使用 REST API 建立內容連接器」一文。

一般內容連接器會執行下列工作：

讀取及處理設定參數。
從第三方內容存放區提取可建立索引的資料片段 (稱為「項目」)。
將 ACL、中繼資料和內容資料結合成可建立索引的項目。
為 Cloud Search 資料來源建立項目索引。
(選用) 監聽來自第三方內容存放區的變更通知。變更通知會轉換為索引要求，以便讓 Cloud Search 資料來源與第三方存放區保持同步。只有在存放區支援變更偵測功能時，連接器才會執行這項工作。

使用 Content Connector SDK 建立內容連接器

以下各節說明如何使用 Content Connector SDK 建立內容連接器。

設定依附元件

您必須在建構檔案中加入特定依附元件，才能使用 SDK。按一下下方分頁標籤，即可查看建構環境的依附元件：

Maven

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

Gradle

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

建立連接器設定

每個連接器都有設定檔，其中包含連接器使用的參數，例如存放區的 ID。參數定義為鍵-值組合，例如 api.sourceId=1234567890abcdef。

Google Cloud Search SDK 包含多個 Google 提供的設定參數，所有連接器都會使用這些參數。您必須在設定檔中宣告下列 Google 提供的參數：

針對內容連接器，您必須宣告 api.sourceId 和 api.serviceAccountPrivateKeyFile，因為這些參數會指出存放區的位置，以及存取存放區所需的私密金鑰。

針對身分連接器，您必須宣告 api.identitySourceId，因為這個參數可識別外部身分來源的位置。如果您要同步處理使用者，也必須將 api.customerId 宣告為貴企業 Google Workspace 帳戶的專屬 ID。

除非您想覆寫 Google 提供的其他參數的預設值，否則不需要在設定檔中宣告這些參數。如要進一步瞭解 Google 提供的設定參數 (例如如何產生特定 ID 和金鑰)，請參閱「Google 提供的設定參數」。

您也可以定義專屬的存放區參數，以便在設定檔中使用。

將設定檔傳遞至連接器

設定系統屬性 config，將設定檔傳遞至連接器。您可以在啟動連接器時，使用 -D 引數設定屬性。舉例來說，下列指令會使用 MyConfig.properties 設定檔啟動連接器：

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

如果沒有這個引數，SDK 會嘗試存取名為 connector-config.properties 的預設設定檔。

決定檢索策略

內容連接器的主要功能是遍歷存放區並為其資料建立索引。您必須根據存放區中資料的大小和版面配置，實作檢索策略。您可以自行設計策略，也可以從 SDK 中導入的下列策略中選擇：

完整檢查策略

完整檢索策略會掃描整個存放區，並盲目為每個項目建立索引。當您擁有小型存放區，且每次建立索引時都能負擔完整檢視的額外負擔時，通常會採用這種策略。

這種檢索策略適合用於大多為靜態、非階層式資料的小型存放區。如果變更偵測作業難以執行，或不受程式庫支援，您也可以使用這項檢視策略。

清單檢索策略

清單檢查策略會掃描整個存放區 (包括所有子節點)，判斷每個項目的狀態。接著，連接器會進行第二次掃描，只為上次索引後新增或更新的項目建立索引。這項策略通常用於針對現有索引執行遞增更新 (而非每次更新索引時都必須進行完整的遍歷)。

當變更偵測作業難以執行，或不受程式庫支援，且您有非階層資料，以及處理非常大型的資料集時，這項檢視策略就很適合。

圖表遍歷

圖表檢索策略會掃描整個父項節點，判斷每個項目的狀態。接著，連接器會進行第二次掃描，並只為根節點中新增或自上次建立索引後更新的項目建立索引。最後，連接器會傳遞任何子項 ID，然後為子項節點中新增或已更新的項目建立索引。連接器會繼續遞迴所有子節點，直到所有項目都處理完畢為止。這類檢查通常用於階層式存放區，因為在這種情況下，列出所有 ID 並不切實。

如果您有需要檢索的階層式資料 (例如一系列目錄或網頁)，這項策略就很適合。

這些遍歷策略各自由 SDK 中的範本連接器類別實作。雖然您可以自行實作剖析策略，但這些範本可大幅加快連接器的開發作業。如要使用範本建立連接器，請前往對應於您檢索策略的部分：

使用範本類別建立完整的檢索連接器
使用範本類別建立清單檢視連接器
使用範本類別建立圖表檢索連接器

使用範本類別建立完整的檢索連接器

本節說明文件會參照 FullTraversalSample 範例中的程式碼片段。

實作連接器的進入點

連接器的進入點為 main() 方法。這個方法的主要工作是建立 Application 類別的例項，並叫用其 start() 方法來執行連接器。

在呼叫 application.start() 之前，請使用 IndexingApplication.Builder 類別將 FullTraversalConnector 範本例項化。FullTraversalConnector 會接受您實作方法的 Repository 物件。下列程式碼片段說明如何實作 main() 方法：

FullTraversalSample.java

建立內容連接器

使用 Content Connector SDK 建立內容連接器

設定依附元件

Maven

Gradle

建立連接器設定

將設定檔傳遞至連接器

決定檢索策略

使用範本類別建立完整的檢索連接器

實作連接器的進入點

實作 Repository 介面

取得自訂設定參數

執行完整檢索

設定項目的權限

設定項目的中繼資料

建立可索引項目

將每個可索引項目封裝在迭代器中

後續步驟

使用範本類別建立清單檢索連接器

實作連接器的進入點

實作 Repository 介面

取得自訂設定參數

執行清單檢索

推送商品 ID 和雜湊值

擷取及處理每個項目

處理已刪除的項目

處理未變更的項目

設定項目的權限

設定項目的中繼資料

建立可索引項目

後續步驟

使用範本類別建立圖形檢索連接器

實作連接器的進入點

實作 Repository 介面

取得自訂設定參數

執行圖表檢索

推送商品 ID 和雜湊值

擷取及處理每個項目

處理已刪除的項目

設定項目的權限

設定項目的中繼資料

建立可索引項目

將子項 ID 放入 Cloud Search 索引處理佇列

後續步驟

使用 REST API 建立內容連接器

決定檢索策略

實作檢索策略和索引項目

處理存放區變更

實作 `Repository` 介面

實作 `Repository` 介面

實作 `Repository` 介面