本頁面將介紹程式化搜尋引擎設定檔背後的基本概念,
總覽
如果「控制台」無法提供您需要的自訂層級,建議您採用程式化搜尋 XML 格式,這種格式不但能讓您擁有更多掌控權和彈性,還能使用更強大的功能。
如要使用程式化搜尋引擎設定檔,請先透過程式化搜尋引擎控制台建立基本的搜尋引擎。建立搜尋引擎後,您可以從控制台的「總覽」頁面下載註解和結構定義 XML 檔案。
XML 基本概念
可擴充標記語言 (XML) 是一種一般用途的標記語言。是可以讀取的標記文字。舉例來說,程式化搜尋 XML 格式包含下列標記:<Context> </Context>
和 <LookAndFeel> </LookAndFeel>
。
如同任何 XML 檔案,程式化搜尋引擎規格必須符合 XML 語法 (<element attribute="value">content</element>
),且格式必須正確。XML 有以下規則:
- XML 要求您必須在頂層標記前面加上 XML 宣告 (
<?xml version="1.0"?>
),但程式化搜尋引擎設定檔不需要。 - 所有元素都必須包含起始標記 (
<tag>
) 和結尾標記 (</tag>
)。 - 所有代碼都必須正確加入巢狀結構。您無法使用類似下方的 XML 程式碼:
<sandwich><filling> peanut butter</sandwich></filling>
。格式應該是:<sandwich><filling> peanut butter</filling></sandwich>
。 - XML 會區分大小寫,因此請務必遵循操作說明中標記的大小寫和拼字。
- 所有屬性值都必須以雙引號 (
<element attribute="value">
) 括住。 - 所有屬性都必須在起始標記 (
<element attribute="value">
) 中定義,而不是在結尾標記 (</element>
) 中定義。
您可以使用註解標記 (<!-- your comment here -->
) 自行撰寫附註,程式化搜尋引擎不會以 XML 程式碼剖析這行文字。除了撰寫提醒或說明,您也可以使用註解暫時排除某些 XML 程式碼 (原因可能是想嘗試某些效果或想排解問題)。不過,這些註解不會保留在您從控制台下載的檔案中。如果您想保留註解,在將註解過的 XML 檔案上傳到「控制台」後,建議您保留該檔案的副本。
您可以使用簡單的文字編輯器建立及編輯 XML 檔案。只儲存副檔名為 .xml
的文字檔案 (例如 cse_badminton.xml
)。
程式化搜尋引擎的內容
程式化搜尋引擎有兩個主要元件,每個元件都是由 XML 檔案控管:
- 內容:結構定義 XML 檔案會說明搜尋引擎的基本功能。它可指定搜尋引擎的通用設定,例如是否啟用圖片搜尋或置頂查詢。在控制台中,您可以在「基本」、「修正項目」、「外觀和風格」、「管理員帳戶」和「賺取收益」分頁中定義這些設定。每個搜尋引擎都有專屬的內容檔案。進一步瞭解結構定義 XML 檔案。如要進一步瞭解如何選取最適合搜尋引擎的檔案格式,請參閱選擇適合搜尋引擎的格式。
- 註解:註解 XML 檔案會列出您希望搜尋引擎涵蓋的網頁或網站,並指出您對這些網站在搜尋結果中的排名方式。每個網站及其相關資訊稱為註解,進一步瞭解註解 XML 檔案。
我們不建議你從頭開始建立這類檔案。請改為從控制台的「總覽」頁面下載。
除了這些主要元件外,搜尋引擎也可能包含下列輔助檔案:
- 置頂查詢:促銷活動 XML 檔案會列出由一組預先定義的查詢字詞觸發的一系列自訂結果。當使用者輸入的搜尋字詞與您的查詢字詞完全相符時,宣傳活動會出現在頁面頂端。您可以利用宣傳活動,直接回答使用者的查詢、引導他們取得重要資訊,或將他們引導至搜尋結果網頁頂端,但關聯性更強的網頁。您可以在控制台的「促銷活動」分頁中定義促銷活動。進一步瞭解促銷活動。
- 同義詞:同義詞 XML 檔案會擴大使用者查詢內容,納入搜尋字詞的變體。舉例來說,如果使用者搜尋「simian」,搜尋引擎也會搜尋「Monkey」和「ape」。可在控制台的「同義詞」分頁中定義同義詞。進一步瞭解同義詞。
元件如何搭配運作
結構定義 XML 檔案不會指定要使用的註解檔案,而註解 XML 也不會參照結構定義檔案。程式化搜尋引擎會使用標籤來與背景資訊和註解建立關聯。內容 XML 檔案包含可識別搜尋引擎的標籤,註解 XML 中列出的每個註解都會加上一或多個標籤,指出該標籤所屬的搜尋引擎。如果您變更結構定義檔案中的標籤名稱,必須變更所有已標記該標籤的註解。
雖然您可以上傳多個註解檔案,但當您透過「控制台」下載註解時,程式化搜尋引擎會將所有註解檔案合併成一個註解檔案。註解檔案可讓您在不同的搜尋引擎中靈活自訂相同的網站。舉例來說,某個搜尋引擎可能會只搜尋某些網站,而另一個搜尋引擎可能會刪除這些網站,但另一個搜尋引擎卻能夠宣傳這些網站。
context.xml
以下是 context.xml 檔案範例,內含標籤,用於識別要套用指令碼的搜尋引擎:
<BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> <BackgroundLabels>
annotations.xml
以下列註解檔案為例,說明每個網站 (註解) 如何與標籤建立關聯:
<Annotation about="code.google.com/*" score="1"> <Label name="_include_"/> </Annotation>
建立進階程式化搜尋引擎
建立進階引擎的步驟如下:
- 判斷格式是否符合需求。
- 為搜尋引擎定義規格。
- 告知程式化搜尋引擎要搜尋哪些網站。
- 告知程式化搜尋引擎如何為搜尋結果排名。
編輯程式化搜尋引擎檔案
如要使用 XML 檔案,請前往控制台的「總覽」頁面下載 XML 規格。請勿從頭開始建立檔案。請完成下列步驟:
- 從「控制台」的「總覽」頁面下載結構定義檔案或註解檔案。按一下「搜尋功能」部分中的 [下載] 按鈕。
- 使用可處理 UNIX 樣式行尾的文字編輯器 (WordPad、Emacs 和 TextMate 則不支援;NotePad 則不支援)。不論檔案名稱為何,只要以副檔名
.xml
(例如cx_global.xml
) 儲存即可 - 建議您為已下載的檔案建立備份,如果編輯後的版本無法順利運作,就必須還原至先前的版本。
如果您並未建立副本,而編輯的版本無法正常運作,那麼您需要對檔案進行偵錯,或重新建立搜尋引擎。無趣。
- 編輯 XML 檔案,然後儲存檔案。請確認您的文字編輯器是以萬國碼 (Unicode) 文字文件儲存檔案,而非其他檔案格式。
- 在「總覽」頁面的「搜尋功能」部分下上傳檔案。
選擇合適的格式
開始建立程式化搜尋引擎前,請先決定最符合您需求的格式。避免選用比實際需求更強大複雜的格式,也不要使用容易快速成長的格式。
請從下表中挑選適當的格式。
如要建立 | 使用 | 因為 | 限制 | 更多資訊 |
---|---|---|---|---|
只擁有少數網站的一或多個搜尋引擎 | 控制台 | 如要快速建立程式化搜尋引擎,您可以填寫文字方塊,而不要使用文字編輯器建立檔案並上傳檔案。 | 當您熟悉程式化搜尋引擎,以及如何建立內含少數網站的搜尋引擎,「控制台」最實用。 | 開始使用 |
使用大量網站的複雜搜尋引擎,會使用動態消息 | 結構定義檔案和註解檔案 | 程式化搜尋引擎檔案可讓您更全面地掌控搜尋引擎,並更輕鬆地定義及管理網站。 即使您打算利用背景資訊和註解檔案建立搜尋引擎,我們仍建議您熟悉「控制台」。 |
搜尋引擎越常,搜尋引擎就越複雜。您需要瞭解程式化搜尋元素和屬性,雖然這項任務並不難,但這需要您投入一些時間。
不過很抱歉,您必須閱讀開發人員指南的其餘部分,這並不是最值得期待的閱讀資料。 |
內容:定義搜尋引擎規格和註解:選取網站 |