使用設定檔建立程式化搜尋引擎

本頁說明程式化搜尋引擎設定檔背後的基本概念。

  1. 總覽
  2. 程式化搜尋引擎的運作方式
  3. 各項元件如何搭配運作
  4. 建立搜尋引擎
  5. 編輯程式化搜尋引擎檔案
  6. 選擇合適的格式

總覽

如果控制台無法提供您需要的自訂程度,可以考慮使用程式化搜尋 XML 格式,這樣可以賦予您更大的控制能力、靈活度以及更多強大的功能。

如要使用程式化搜尋引擎設定檔,請先透過程式化搜尋引擎控制台建立基本搜尋引擎。建立搜尋引擎後,您可以前往控制台的「總覽」頁面下載註解和內容 XML 檔案。

XML 基本概念

可延伸標記語言 (XML)XML 是一種一般用途的標記語言。是附有標記的文字。舉例來說,程式化搜尋 XML 格式包含下列標記:<Context> </Context><LookAndFeel> </LookAndFeel>

和所有 XML 檔案一樣,程式化搜尋引擎規格必須符合 XML 語法 (<element attribute="value">content</element>) 且格式正確。XML 有以下規則:

  • XML 規定您必須將 XML 宣告 (<?xml version="1.0"?>) 放在頂層標記之前,但程式化搜尋引擎設定檔則不需要。
  • 所有元素都必須具有起始標記 (<tag>) 和結束標記 (</tag>)。
  • 所有代碼都必須正確巢狀結構。無法使用類似如下的 XML 程式碼:<sandwich><filling> peanut butter</sandwich></filling>。但應如下所示:<sandwich><filling> peanut butter</filling></sandwich>
  • XML 會區分大小寫,因此請確實遵循操作說明中標記的大小寫和拼字。
  • 所有屬性值都必須以雙引號 (<element attribute="value">) 括住。
  • 所有屬性都必須在起始標記 (<element attribute="value">) 中定義,而非結尾標記 ( </element>)。

您可以使用註解標記 (<!-- your comment here -->) 撰寫筆記,程式化搜尋引擎不會將這行文字剖析為 XML 程式碼。除了撰寫提醒或說明,您也可以透過註解暫時避免讓部分 XML 程式碼停止收取佣金 (例如實驗特定效果或排解問題)。不過,從控制台下載的檔案中不會保留這些註解。如果您要保留註解,則即使已註解 XML 檔案上傳到控制台,仍需保留一份副本。

您可以使用簡單的文字編輯器來建立和編輯 XML 檔案。只要使用副檔名為 .xml (例如 cse_badminton.xml) 的文字檔案即可。

返回頁首

程式化搜尋引擎的運作方式

程式化搜尋引擎包含兩個主要元件,每個元件都由 XML 檔案控制:

  • 內容:內容 XML 檔案會說明搜尋引擎的基本功能,它可指定搜尋引擎的全域設定,例如是否已啟用圖片搜尋或置頂查詢。每個搜尋引擎都有專屬的內容檔案。進一步瞭解結構定義 XML 檔案。如要進一步瞭解如何為您的搜尋引擎選取最合適的檔案格式,請參閱為搜尋引擎選擇合適的格式
  • 註解:註解 XML 檔案會列出您希望搜尋引擎涵蓋的網頁或網站,並指出您對這些網站在搜尋結果中的排名偏好設定。每個網站及其相關資訊稱為「註解」進一步瞭解註解 XML 檔案。

我們不建議您從頭開始建立這兩種檔案。請改從控制台的「總覽」頁面下載這些資料。

除了這些主要元件外,搜尋引擎也可能有以下輔助檔案:

  • 促銷活動:促銷活動 XML 檔案會列出一系列由預先定義的查詢字詞所觸發的自訂結果。當使用者輸入的搜尋字詞與您的查詢字詞完全相符時,置頂查詢會出現在網頁頂端。您可以使用宣傳活動直接回答使用者的查詢、引導他們找到重要資訊,或是將他們引導至結果網頁尚未出現在結果網頁上的特別相關網頁。控制台中的「促銷活動」分頁定義促銷活動。進一步瞭解促銷活動。
  • 同義詞:同義詞 XML 檔案可擴大使用者查詢內容,包含搜尋字詞的變體。例如,如果使用者搜尋「simian」搜尋引擎也會搜尋「猴子」和「ape」。在「控制台」中,同義詞是在「同義詞」分頁中定義。進一步瞭解同義詞。

各項元件如何搭配運作

結構定義 XML 檔案未指定要使用的註解檔案,且註解 XML 未參照結構定義檔案。程式化搜尋引擎會使用標籤來關聯背景資訊和註解。內容 XML 檔案包含用於識別搜尋引擎的標籤,而註解 XML 中列出的每個註解,皆會標記一或多個標籤,以識別其所屬的搜尋引擎。如果您在內容檔案中變更標籤名稱,您必須變更標記該標籤的所有註解。

雖然您可以上傳多個註解檔案,但透過控制台下載這些檔案時,程式化搜尋引擎會將所有註解檔案合併成一個註解檔案。註解檔案讓各種搜尋引擎都能彈性自訂同一個網站。舉例來說,某個搜尋引擎可能會針對某些網站進行搜尋,另一個可能刪除這些網站,而另一個搜尋引擎能宣傳這些網站。

context.xml

以下的 context.xml 檔案範例包含可識別對應搜尋引擎的標籤:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

以下是註解檔案範例,說明每個網站 (註解) 如何與某個標籤建立關聯:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

返回頁首

建立進階程式化搜尋引擎

建立進階引擎的步驟如下:

  1. 決定格式是否符合您的需求。
  2. 定義搜尋引擎的規格
  3. 告知程式化搜尋引擎要搜尋哪些網站
  4. 向程式化搜尋引擎說明搜尋結果的排名方式

編輯程式化搜尋引擎檔案

如要使用 XML 檔案,請前往控制台的「總覽」頁面下載 XML 規格。請勿從頭開始建立檔案。請完成下列步驟:

  1. 從控制台的「總覽」頁面下載結構定義檔案或註解檔案。按一下「搜尋功能」部分中的 [下載] 按鈕。
  2. 使用可處理 UNIX 型行結尾的文字編輯器 (WordPad、Emacs 和 TextMate 可執行結尾,NotePad 則不行)。您可以用什麼方式命名檔案,只要以 .xml 的副檔名儲存檔案即可 (例如 cx_global.xml)
  3. 為下載的檔案備份,以防編輯後未正常運作,然後還原到先前版本。

    如果不建立副本,讓您編輯的版本無法正常運作,則需要對檔案偵錯,或是重新建立搜尋引擎。無趣。

  4. 編輯並儲存 XML 檔案。請確定您的文字編輯器是以 Unicode 文字文件儲存檔案,而不是其他檔案格式。
  5. 在「總覽」頁面的「搜尋功能」部分下上傳檔案。

選擇合適的格式

開始建立程式化搜尋引擎之前,請先確定最符合您需求的格式。建議您不要選用比所需功能更強大且更複雜的格式,也不要使用很快就會成長的廣告格式。

請參閱下表挑選合適的格式。

如要建立 使用 由於 限制 更多資訊
網站數量不多的一或多個搜尋引擎 控制台 您不需要透過文字編輯器建立檔案並上傳檔案,只需填寫文字方塊,就能快速建立程式化搜尋引擎。 當您熟悉程式化搜尋引擎,以及在少數網站上建立搜尋引擎時,控制台最為有用。 開始使用
使用資訊提供大量網站的複雜搜尋引擎 內容檔案和註解檔案

程式化搜尋引擎檔案讓您更能掌控搜尋引擎,也能讓定義及管理網站的工作變得更簡單。

即使您打算使用內容和註解檔案建立搜尋引擎,建議您先熟悉「控制台」的相關知識。

您自訂的搜尋引擎越多,結果就越複雜。您必須瞭解程式化搜尋元素和屬性雖然不容易找出,但需要您花點時間。

很可惜,您還是得閱讀開發人員指南的其餘部分,這本來不是最引人注目的閱讀資料。

背景資訊:定義搜尋引擎規格註解:選擇網站

返回頁首