XML API 參考資料

本頁是指 Custom Search JSON API 的 XML 版本,僅供 Google Site Search 客戶使用。

  1. 總覽
  2. 程式化搜尋引擎要求格式
    1. 要求總覽
    2. 查詢字詞
    3. 請求參數
      1. WebSearch 查詢範例
      2. WebSearch 查詢參數定義
      3. 進階搜尋
      4. 進階搜尋查詢參數
      5. 特殊查詢字詞
      6. 圖片查詢範例
      7. 圖片搜尋查詢參數
      8. 要求限制
    4. 國際化查詢和結果簡報
      1. 字元編碼
      2. 介面語言
      3. 簡體中文和繁體中文搜尋
    5. 篩選結果
      1. 自動篩選搜尋結果
      2. 語言和國家/地區篩選
      3. 使用安全搜尋過濾成人內容
  3. XML 結果
    1. Google XML 結果 DTD
    2. 關於 XML 回應
    3. 一般、圖片和進階搜尋查詢的 XML 結果
      1. 一般/進階搜尋:查詢範例和 XML 結果
      2. 一般/進階搜尋:XML 標記
      3. 圖片搜尋查詢的 XML 結果
      4. 圖片搜尋:查詢範例和 XML 結果
      5. 圖片搜尋:XML 標記

總覽

Google WebSearch 服務可讓 Google 站內搜尋客戶在自己的網站中顯示 Google 搜尋結果。WebSearch 服務使用簡單的 HTTP 通訊協定來提供搜尋結果。搜尋管理員可完全掌控要求搜尋結果的方式,以及向使用者顯示結果的方式。本文件說明 Google 搜尋要求和結果格式的技術詳細資訊。

如要擷取 Google WebSearch 結果,應用程式會將簡單的 HTTP 要求傳送至 Google。接著,Google 會以 XML 格式傳回搜尋結果。XML 格式的結果可讓您自訂搜尋結果的顯示方式。

WebSearch 要求格式

請求總覽

Google 搜尋要求是標準的 HTTP GET 指令。當中包含與查詢相關的一組參數。這些參數會以 name=value 組合的形式包含在要求網址中,並以連接號 (&) 字元分隔。參數包含搜尋查詢等資料,以及專屬引擎 ID (cx),用來識別發出 HTTP 要求的引擎。WebSearch 或圖片搜尋服務會根據您的 HTTP 要求傳回 XML 結果。

查詢字詞

大部分的搜尋要求都包含一或多個查詢字詞。查詢字詞會顯示為搜尋要求中的參數值。

查詢字詞可指定數種資訊類型,以篩選及整理 Google 傳回的搜尋結果。查詢可以指定:

  • 要納入或排除的字詞或詞組
    • 搜尋查詢中的所有字詞 (預設)
    • 搜尋查詢中有完全相符的詞組
    • 搜尋查詢中的任何字詞或詞組
  • 在文件中的位置尋找搜尋字詞
    • 文件中的任何位置 (預設)
    • 只在文件內文
    • 僅在文件標題中
    • 僅在文件網址中
    • 僅限文件中的連結
  • 文件本身的限制
    • 納入或排除特定檔案類型的文件 (例如 PDF 檔案或 Word 文件)
  • 會傳回特定網址相關資訊的特殊網址查詢,而不是搜尋
    • 傳回網址一般資訊 (例如開啟目錄類別、摘要或語言) 的查詢
    • 會傳回一組連結到特定網址網頁的查詢
    • 這些查詢會傳回一組與指定網址類似的網頁

預設搜尋

搜尋查詢參數值必須逸出網址。請注意,您必須以加號 (「+」) 取代搜尋查詢中的所有空白字元序列。這一點將在本文件的網址逸出一節中進一步說明。

系統會使用 q 參數將搜尋字詞提交至 WebSearch 服務。搜尋查詢字詞範例如下:

q=horses+cows+pigs

根據預設,Google WebSearch 服務只會傳回包含搜尋查詢中所有字詞的文件。

要求參數

本節列出提出搜尋要求時可以使用的參數。參數會分割成兩份清單,第一個清單包含與所有搜尋要求相關的參數。第二份清單包含只與進階搜尋要求相關的參數。

您必須提供以下三個請求參數:

  • client 參數必須設為 google-csbe
  • output 參數會指定傳回 XML 結果的格式;結果可以使用 (xml) 或不使用 (xml_no_dtd) 參照 Google 的 DTD 傳回結果。建議您將這個值設為 xml_no_dtd注意:如果不指定這個參數,系統將以 HTML 而非 XML 傳回結果。
  • cx 參數,代表引擎的專屬 ID。

除了上述參數之外,最常使用的要求參數如下:

  • num:要求的搜尋結果數量
  • q:搜尋字詞
  • start:結果的起始索引

WebSearch 查詢範例

以下範例顯示幾個 WebSearch HTTP 要求,以便說明不同查詢參數的使用方式。如需不同查詢參數的定義,請參閱本文件的「網頁搜尋查詢參數定義」和「進階搜尋查詢參數」章節。

這項要求會針對查詢字詞「紅色 sox」(q=red+sox) 要求前 10 筆結果 (start=0&num=10)。查詢也會指定結果應來自加拿大的網站 (cr=countryCA),且應以法文撰寫 (lr=lang_fr)。最後,查詢會指定 clientoutputcx 參數的值,這三項參數均為必要參數。

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

本範例使用某些進階搜尋查詢參數進一步自訂搜尋查詢。此要求使用 as_q 參數 (as_q=red+sox),而非 q 參數。也會使用 as_eq 參數從搜尋結果中排除任何含有「Yankees」一詞的文件 (as_eq=yankees)。

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

WebSearch 查詢參數定義

c2coff
說明

(選用) c2coff 參數會啟用或停用簡體中文及繁體中文搜尋功能。

這個參數的預設值為 0 (零),表示這項功能已啟用。c2coff 參數的值如下:

動作
1 已停用
0 已啟用
例子 q=google&c2coff=1

用戶端
說明

必填client 參數必須設為 google-csbe

例子 q=google&client=google-csbe

cr
說明

(選用) cr 參數會將搜尋結果限制為來自特定國家/地區的文件。您可以在 cr 參數的值中使用布林值運算子

Google WebSearch 會分析以下項目,判斷文件的來源國家/地區:

  • 文件網址的頂層網域 (TLD)
  • 網路伺服器 IP 位址的地理位置

如需這個參數的有效值清單,請參閱國家/地區 (cr) 參數值一節。

例子 q=Frodo&cr=countryNZ

cx
說明

必填cx 參數會指定用於識別自訂搜尋引擎的專屬程式碼。您必須使用 cx 參數指定程式化搜尋引擎,才能從該引擎擷取搜尋結果。

如要找出 cx 參數的值,請在引擎中前往「控制台」>「程式碼」分頁,然後找到要顯示搜尋框的網頁,然後在文字區域中找到「將此程式碼貼到網頁內」。搜尋結果會顯示在 Google 代管的網頁上。」

例子 q=Frodo&cx=00255077836266642015:u-scht7a-8i

過濾器
說明

(選用) filter 參數可啟用或停用 Google 搜尋結果的自動篩選功能。如要進一步瞭解 Google 搜尋結果篩選器,請參閱本文件的「自動篩選」一節。

filter 參數的預設值為 1,表示功能已啟用。這個參數的有效值如下:

動作
1 已停用
0 已啟用

注意:根據預設,Google 會對所有搜尋結果套用篩選功能,以改善這些搜尋結果的品質。

例子 q=google&filter=0

gl
說明

(選用) gl 參數值是雙字母的國家/地區代碼。在 WebSearch 中,gl 參數會提升來源國家/地區與參數值相符的搜尋結果。如需有效值的清單,請參閱國家/地區代碼一節。

在 WebSearch 要求中指定 gl 參數值,應能提高搜尋結果的關聯性。這對國際客戶而言尤其重要,更具體地說的是,對於美國以外語系國家/地區的客戶。

例子

這項要求會增強 Google 網頁搜尋結果在英國編寫的文件數量:
q=pizza&gl=uk


hl
說明

(選用) hl 參數會指定使用者介面的介面語言 (主機語言)。為提升搜尋結果的效能與品質,我們強烈建議您明確設定這個參數。

詳情請參閱國際化查詢和結果呈現介面語言一節。如需支援的語言清單,請參閱支援的介面語言

例子

這項要求指定了法語葡萄酒的廣告。(Vin 是法文的法文術語)。

q=vin&ip=10.10.10.10&ad=w5&hl=fr

Hq
說明

(選用) hq 參數會將指定查詢字詞附加至查詢,如同與邏輯 AND 運算子合併使用。

例子

這項要求搜尋「披薩」和「起司」。運算式與 q=pizza+cheese 相同。

q=pizza&hq=cheese


ie
說明

(選用) ie 參數會設定要用來解譯查詢字串的字元編碼配置。ie 的預設值為 latin1

請參閱字元編碼一節,進一步瞭解何時可能需要使用這個參數。

如需可能的 ie 值清單,請參閱「字元編碼配置」一節。

例子 q=google&ie=utf8&oe=utf8
lr
說明

(選用) lr (語言限制) 參數可將搜尋結果限制為以特定語言撰寫的文件。

Google WebSearch 會分析以下項目,判斷文件語言:

  • 文件網址的頂層網域 (TLD)
  • 文件內的語言中繼標記
  • 文件內文使用的主要語言
  • 文件內文中使用次要語言 (如果有的話)

如需這個參數的有效值清單,請參閱語言 (lr) 集合值一節。

例子 q=Frodo&lr=lang_en

num
說明

(選用) num 參數可指定要傳回的搜尋結果數量。

num 的預設值為 10,最大值為 20。如果要求超過 20 筆結果,系統只會傳回 20 筆結果。

注意:如果搜尋結果總數少於要求的結果數量,系統將傳回所有可用的搜尋結果。

例子 q=google&num=10

oe
說明

(選用) oe 參數會設定要用來解碼 XML 結果的字元編碼配置。oe 的預設值為 latin1

請參閱字元編碼一節,進一步瞭解何時可能需要使用這個參數。

如需可能的 oe 值清單,請參閱「字元編碼配置」一節。

例子 q=google&ie=utf8&oe=utf8

output
說明

必填output 參數會指定 XML 結果的格式。這個參數唯一有效的值是 xmlxml_no_dtd。下表說明這些參數值有何不同。

輸出格式
xml_no_dtd XML 結果將不會包含 !DOCTYPE 陳述式。(建議提供)
xml XML 結果會包含 Google DTD 參考資料。結果的第二行會識別結果使用的文件定義類型 (DTD):
    <!DOCTYPE GSP SYSTEM "google.dtd">
例子 output=xml_no_dtd
output=xml

說明

(選用) q 參數會指定使用者輸入的搜尋查詢。即使此參數為選用參數,您至少須為其中一個查詢參數 (as_epqas_lqas_oqas_q) 指定值,才能取得搜尋結果。

還有一些特殊查詢字詞可以當做 q 參數值的一部分。如需這些字詞的清單及定義,請參閱特殊查詢字詞

Google 搜尋控制台會提供一份報告,列出使用 q 參數提交的熱門查詢。

注意:針對 q 參數指定的值必須逸出網址。

例子 q=vacation&as_oq=london+paris

安全
說明

(選用) safe 參數會指示如何根據成人和色情內容篩選搜尋結果。safe 參數的預設值為 off。有效的參數值如下:

動作
off 停用安全搜尋
medium 啟用安全搜尋
high 啟用更嚴格的安全搜尋功能

如要進一步瞭解這項功能,請參閱「使用安全搜尋過濾成人內容」一節。

例子 q=adult&safe=high

start
說明

(選用) start 參數代表應納入搜尋結果的第一個相符結果。start 參數使用從零開始的索引,表示第一個結果為 0,第二個結果為 1,依此類推。

start 參數可與 num 參數搭配使用,藉此決定要傳回的搜尋結果。請注意,即使與查詢相符的文件數量超過 1000 份,系統也不會傳回超過 1000 筆結果。因此,將設定值設定為 1000 以上時,不會傳回任何結果。

例子 start=10

排序
說明

(選用) sort 參數會指定根據指定運算式排序結果。例如依日期排序。

例子

sort=date


ud
說明

(選用) ud 參數會指出 XML 回應是否應包含搜尋結果的 IDN 編碼網址。IDN (國際網域名稱) 編碼可讓網域以當地語言顯示,例如:

http://www.花井鮨.com

這個參數的有效值為 1 (預設值),表示 XML 結果應包含採用 IDN 編碼的網址以及 0,表示 XML 結果不應包含 IDN 編碼的網址。如果 ud 參數設為 1,則 IDN 編碼的網址會顯示在 XML 結果的 UD 標記中。

如果 ud 參數設為 0,上例中的網址會顯示為:

http://www.xn--elq438j.com.

注意:這是 Beta 版功能,

例子 q=google&ud=1

圖片下方列出的其他查詢參數與進階搜尋查詢相關。提交進階搜尋時,多個參數 (例如 as_eqas_epqas_oq 等) 的值都會納入該搜尋的查詢字詞。圖片顯示 Google 的「進階搜尋」網頁。在圖片中,每個進階搜尋參數的名稱會以red文字寫入該參數所在頁面或其對應欄位旁邊或旁邊。



進階搜尋查詢參數

as_dt
說明

(選用) as_dt 參數可控制要納入或排除 as_sitesearch 參數所命名網站的結果。ie 值分別表示納入和排除。

例子 as_dt=i,as_dt=e

as_epq
說明

(選用) as_epq 參數可識別搜尋結果中所有文件都必須包含的詞組。您也可以使用「詞組搜尋」查詢字詞搜尋詞組。

例子 as_epq=abraham+lincoln

as_eq
說明

(選用) as_eq 參數可識別不應出現在搜尋結果任何文件中的字詞或詞組。您也可以使用「排除」查詢字詞,確保特定字詞或詞組不會顯示在一組搜尋結果的文件中。

例子

q=bass&as_eq=music.


as_lq
說明

(選用) as_lq 參數會指定所有搜尋結果都應包含特定網址的連結。你也可以針對這類查詢使用 link: 查詢字詞。

例子

as_lq=www.google.com


as_nlo
說明

(選用) as_nlo 參數會指定搜尋範圍的起始值。使用 as_nloas_nhi,將包含 as_nlo...as_nhi 的搜尋範圍附加至查詢。

例子

下列指令會將搜尋範圍設為 5 到 10 (含):

as_nlo=5&as_nhi=10

as_nhi
說明

(選用) as_nhi 參數會指定搜尋範圍的結束值。使用 as_nloas_nhi,在查詢中附加包含 as_nlo...as_nhi 的包含搜尋範圍。

例子

下列指令會將搜尋範圍設為 5 到 10 (含):

as_nlo=5&as_nhi=10

as_oq
說明

(選用) as_oq 參數會提供另一份要檢查的文件搜尋字詞。搜尋結果中的每個文件都必須包含至少一個其他搜尋字詞。您也可以在這類查詢中使用「Boolean OR」查詢字詞。

例子

q=vacation&as_oq=London+Paris


as_q
說明

(選用) as_q 參數提供可在文件中檢查的字詞。這個參數也經常用於讓使用者指定在一組搜尋結果內搜尋的其他字詞。

例子

q=president&as_q=John+Adams


as_qdr
說明

(選用) as_qdr 參數會要求指定時間範圍 (快速日期範圍) 的搜尋結果。支援下列值:

d[number] 會要求過去指定天數的結果。
w[number] 會要求過去幾週的結果。
m[number] 會要求過去幾個月的結果。
y[number] 會要求過去幾年的結果。

例子

以下範例會要求過去一年的結果:

as_qdr=y

以下範例會要求過去 10 天的結果:

as_qdr=d10

as_sitesearch
說明

(選用) as_sitesearch 參數可讓您指定所有搜尋結果都是來自特定網站的網頁。你也可以設定 as_dt 參數,藉此將特定網站的網頁從搜尋範圍中排除。

例子

q=vacation&as_sitesearch=www.google.com


特殊查詢字詞

Google WebSearch 允許使用幾個特殊的查詢字詞,以便存取 Google 搜尋引擎的額外功能。這些特殊查詢字詞應包含在 q 要求參數的值中。與其他查詢字詞一樣,特殊查詢字詞必須「網址逸出」。許多特殊查詢字詞含有半形冒號 (:)。這個字元也必須逸出網址,其網址逸出值為 %3A

反向連結 [link:]
說明

link: 查詢字詞會擷取連結至特定網址的網頁組合。搜尋查詢的格式應為 link:URL,而 link: 查詢字詞和網址之間沒有空格。

網址逸出的 link: 版本為 link%3A

您也可以使用 as_lq 要求參數來提交 link: 要求。

注意:使用 link: 時,您無法指定任何其他查詢字詞。

例子

http://www.google.com/search?q=link%3Awww.example.com


布林值「或」搜尋 [OR ]
說明

OR 查詢字詞會擷取含有一系列 (兩個以上) 查詢字詞的文件。如要使用 OR 查詢字詞,請在系列中的每個字詞之間,以大寫英文字母插入搜尋字詞 OR

您也可以使用 as_oq 要求參數,提交搜尋一組字詞中的字詞。

注意:如果搜尋要求指定查詢「倫敦+OR+巴黎」,搜尋結果就會包含至少含有這兩個字詞之一的文件。在某些情況下,搜尋結果中的文件可能會同時包含這兩個字詞。

例子

搜尋倫敦或巴黎:

使用者輸入:london OR paris 查詢字詞:q=london+OR+paris

搜尋度假,並搜尋倫敦或巴黎:

查詢字詞:q=vacation+london+OR+paris

搜尋度假和倫敦、巴黎或巧克力:

查詢字詞:  q=vacation+london+OR+paris+OR+chocolates

搜尋「度假」和「巧克力」以及「倫敦或巴黎」, 而且巧克力的重量最低:

查詢字詞:  q=vacation+london+OR+paris+chocolates

在同時包含倫敦或巴黎的文件中,搜尋「度假」、「巧克力」和「花」:

查詢字詞:  q=vacation+london+OR+paris+chocolates+flowers

搜尋「度假」和「倫敦」或「巴黎」,並搜尋其中一種巧克力或花卉:

查詢字詞:  q=vacation+london+OR+paris+chocolates+OR+flowers

排除查詢字詞 [-]
說明

「排除」(-) 查詢字詞會將特定搜尋要求的結果限制為「不含」特定字詞或詞組的文件。如要使用「排除」查詢字詞,請在相符文件前面加上「-」(減號) 表示要排除的字詞或詞組。

網址逸出的 - 版本為 %2D

如果搜尋字詞有多個意義,排除查詢字詞就相當實用。例如,「低音」一詞可能會傳回與魚或音樂相關的結果。如果要尋找魚類的文件,可以使用「排除」查詢字詞,將與音樂相關的文件從搜尋結果中排除。

您也可以使用 as_eq 要求參數,從搜尋結果中排除符合特定字詞或詞組的文件。

例子 使用者輸入內容: bass -music
查詢字詞: q=bass+%2Dmusic

檔案類型排除 [ -filetype: ]
說明

-filetype: 查詢字詞會從搜尋結果中排除含有特定副檔名 (例如「.pdf」或「.doc」) 的文件。搜尋查詢的格式應為 -filetype:EXTENSION,且 -filetype: 查詢字詞和指定副檔名之間沒有空格。

網址逸出的 -filetype: 版本為 %2Dfiletype%3A

注意:您可以在查詢中加入更多 -filetype: 查詢字詞,將多個檔案類型從搜尋結果中排除。在搜尋查詢中,你必須針對要從搜尋結果排除的每個副檔名,設定一個 -filetype: 查詢字詞。

Google 支援的檔案類型包括:

  • Adobe 可攜式文件格式 (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1、wk2、wk3、wk4、wk5、wki、wks、wku)
  • Lotus WordPro (lwp)
  • 馬克筆 (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (文件)
  • Microsoft Works (wks、wps、wdb)
  • Microsoft Write (wri)
  • RTF 格式 (rtf)
  • Shockwave Flash (swf)
  • 文字檔案 (整數、txt)。

日後可能會新增其他檔案類型。您隨時可以參閱 Google 的檔案類型常見問題,查看最新清單。

例子

以下範例會傳回提及「Google」但並非 PDF 文件的文件:
q=Google+%2Dfiletype%3Apdf

以下範例會傳回提及「Google」但不含 PDF 和 Word 的文件:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


檔案類型篩選 [ filetype: ]
說明

filetype: 查詢字詞會限制搜尋結果只能顯示含有特定副檔名的文件,例如「.pdf」或「.doc」。搜尋查詢的格式應為 filetype:EXTENSION,並在 filetype: 查詢字詞和指定副檔名之間留有空格。

網址逸出的 filetype: 版本為 filetype%3A

您可以在查詢中加入更多 filetype: 查詢字詞,將搜尋結果限制為符合任一副檔名的文件。你必須在搜尋查詢中,針對應該納入搜尋結果的各項副檔名,設定 filetype: 查詢字詞。若有多個 filetype: 查詢字詞,則必須使用 OR 查詢字詞加以分隔。

根據預設,搜尋結果會包含副檔名的任何文件。

Google 支援的檔案類型包括:

  • Adobe 可攜式文件格式 (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1、wk2、wk3、wk4、wk5、wki、wks、wku)
  • Lotus WordPro (lwp)
  • 馬克筆 (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (文件)
  • Microsoft Works (wks、wps、wdb)
  • Microsoft Write (wri)
  • RTF 格式 (rtf)
  • Shockwave Flash (swf)
  • 文字檔案 (整數、txt)。

日後可能會新增其他檔案類型。您隨時可以參閱 Google 的檔案類型常見問題,查看最新清單。

例子

以下範例會傳回提及「Google」的 PDF 文件:
q=Google+filetype%3Apdf

以下範例會傳回含有「Google」的 PDF 和 Word 文件:
q=Google+filetype%3Apdf+OR+filetype%3Adoc


包含查詢字詞 +
說明

「包含 (+)」查詢字詞指定搜尋結果中列出的所有文件都必須包含特定字詞或詞組。如要使用「包含」查詢字詞,請在所有搜尋結果前面加上「+」(加號)。

+ 的網址逸出版本 (加號) 為 %2B

您應在 Google 通常會捨棄的常用字詞之前,先使用 + 來識別搜尋結果。

例子 使用者輸入內容: Star Wars Episode +I
查詢字詞: q=Star+Wars+Episode+%2BI

連結僅限搜尋,所有字詞 [ allinlinks: ]
說明

如要使用 allinlinks: 查詢字詞,搜尋結果的文件必須包含網址連結中的所有字詞。搜尋查詢的格式應為 allinlinks:,後面接著搜尋查詢中的文字。

如果您的搜尋查詢包含 allinlinks: 查詢字詞,Google 只會檢查文件中的網址連結是否包含您搜尋查詢中的字詞,忽略文件中的其他文字、文件標題與每份文件的網址。請注意,文件網址與文件中的網址連結不同,

網址逸出的 allinlinks: 版本為 allinlinks%3A

例子 使用者輸入內容:allinlinks: Google search
查詢字詞:q=allinlinks%3A+Google+search

詞組搜尋
說明

詞組搜尋 (") 查詢字詞可讓您搜尋完整的詞組,方法是以引號括住詞組,或是以連字號連接這些詞組。

" 的網址逸出版本 (引號) 是 %22

在搜尋名言引號或專有名稱時,詞組搜尋非常實用。

您也可以使用 as_epq 要求參數來提交詞組搜尋。

例子 使用者輸入:"Abraham Lincoln"
查詢字詞: q=%22Abraham+Lincoln%22

純文字搜尋,所有字詞 [allintext:]
說明

使用 allintext: 查詢字詞時,搜尋結果中的每個文件都必須包含文件內文中的所有字詞。查詢的格式應為 allintext:,後面接著搜尋查詢中的文字。

如果您的搜尋查詢包含 allintext: 查詢字詞,Google 只會檢查文件內文與搜尋查詢中的字詞,忽略這些文件、文件標題和文件網址中的連結。

網址逸出的 allintext: 版本為 allintext%3A

例子 以下範例指定在搜尋結果包含的所有文件內文中,必須出現「Google」和「search」這兩個字詞:
使用者輸入內容:allintext:Google search
查詢字詞:q=allintext%3AGoogle+search

標題搜尋,單一字詞 [intitle:]
說明

intitle: 查詢字詞會限制搜尋結果只能顯示文件標題中含有特定字詞的文件。搜尋查詢的格式應為 intitle:WORD,且 intitle: 查詢字詞和下列字詞之間沒有空格。

注意:您可以指定文件標題中必須加入多個字詞,只要在每個這類字詞前方加上 intitle: 查詢字詞即可。您也可以使用 allintitle: 查詢字詞,指定搜尋結果中列出的文件標題必須包含所有查詢字詞。

網址逸出的 intitle: 版本為 intitle%3A

例子

以下範例指定搜尋結果的所有文件標題中均須顯示「Google」這個字詞,且這些文件的標題、網址、連結或內文中的任何位置都必須出現「search」這個字詞:
使用者輸入內容:intitle:Google search
查詢字詞:q=intitle%3AGoogle+search


標題搜尋,所有字詞 [allintitle:]
說明

allintitle: 查詢字詞會限制搜尋結果只能顯示文件標題中含有所有查詢字詞的文件。如要使用「allintitle:」查詢字詞,請在搜尋查詢的開頭加入「allintitle:」。

注意:在搜尋查詢開頭加上 allintitle:,等同於在搜尋查詢的每個字詞前方加入 intitle:

allintitle: 的網址逸出版本為 allintitle%3A

例子

以下範例指定在搜尋結果的任何文件標題中,必須出現「Google」和「search」這兩個字詞:
使用者輸入內容: allintitle: Google search
查詢字詞: q=allintitle%3A+Google+search


網址搜尋,單一字詞 [inurl:]
說明

inurl: 查詢字詞會限制搜尋結果只能顯示文件網址中含有特定字詞的文件。搜尋查詢的格式應為 inurl:WORD,在 inurl: 查詢字詞和下列字詞之間沒有空格。

inurl: 查詢字詞會忽略標點符號,且只會使用 inurl: 運算子後面的第一個字詞。您可以指定多個須包含在文件網址中的字詞,只要在每個這類字詞前面加上 inurl: 查詢字詞即可。您也可以使用 allinurl: 查詢字詞,指定搜尋結果中列出的文件網址都必須包含所有查詢字詞。

網址逸出的 inurl: 版本為 inurl%3A

例子

以下範例指定搜尋結果中所有文件的網址均須出現「Google」這個字詞,且這些文件的標題、網址、連結或內文中的任何位置都必須出現「search」這個字詞:
使用者輸入內容: inurl:Google search
查詢字詞: q=inurl%3AGoogle+search


網址搜尋,所有字詞 [allinurl:]
說明

allinurl: 查詢字詞會限制搜尋結果只能顯示文件網址中含有所有查詢字詞的文件。如要使用 allinurl: 查詢字詞,請在搜尋查詢的開頭加入 allinurl:

allinurl: 查詢字詞會忽略標點符號,因此只適用於字詞,不適用於網址元件。例如,allinurl: uk/scotland 會將結果限制在網址中含有「uk」和「scotland」這兩個字詞的文件,但不會要求這兩個字詞按任何特定順序顯示,或必須用斜線分隔。

網址逸出的 allinurl: 版本為 allinurl%3A

例子

以下範例指定在搜尋結果的任何文件的網址中,必須出現「Google」和「search」這兩個字詞:
使用者輸入內容: allinurl: Google search
查詢字詞: q=allinurl%3A+Google+search



網路文件資訊 [info:]
說明

只要網址已納入 Google 的搜尋索引,info: 查詢字詞就會擷取該網址的一般資訊。搜尋查詢的格式應為 info:URL,在 info: 查詢字詞和網址之間留有空格。

網址逸出的 info: 版本是 info%3A

注意:使用 info: 時,您無法指定任何其他查詢字詞。

例子 使用者輸入: info:www.google.com
查詢字詞: q=info%3Awww.google.com

圖片查詢範例

以下範例會顯示幾個圖片 HTTP 要求,以便說明不同查詢參數的使用方式。本文件的「圖片查詢參數定義」章節會提供不同查詢參數的定義。

這項要求會要求提供 .png 檔案類型的「猴子」(q=monkey) 的前 5 筆結果 (start=0&num=5)。最後,查詢會指定 clientoutputcx 參數的值,這三個參數皆為必要值。

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

圖片搜尋查詢參數

as_filetype
說明

(選用) 傳回指定類型的圖片。允許的值包括:bmpgifpngjpgsvg

例子 q=google&as_filetype=png

imgsz
說明

(選用) 傳回指定大小的圖片,其中尺寸可以是下列其中一種:

  • icon (小)
  • small|medium|large|xlarge (中)
  • xxlarge (大)
  • huge (超大)

例子 q=google&as_filetype=png&imgsz=icon

圖片類型
說明

(選用) 傳回特定類型的圖片,可以是下列其中一種類型:

  • clipart (飛機)
  • face (臉孔)
  • lineart (線性)
  • news (新聞)
  • photo (相片)

例子 q=google&as_filetype=png&imgtype=photo

標誌
說明

(選用) 傳回黑白、灰階或彩色圖片:

  • mono (黑白)
  • gray (灰階)
  • color (顏色)

例子 q=google&as_filetype=png&imgc=gray

圖片顏色
說明

(選用) 傳回特定主色的圖片:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
例子 q=google&as_filetype=png&imgcolor=yellow

as_rights
說明

(選用) 依授權建立的篩選器。支援的值包括:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

例子 q=cats&as_filetype=png&as_rights=cc_attribute

要求限制

下方圖表列出了您傳送給 Google 的搜尋要求限制:

元件 限制 註解
搜尋要求長度 2,048 個位元組  
查詢字詞數量 10 包含下列參數中的字詞:qas_epqas_eqas_lqas_oqas_q
結果數量 20 如果將 num 參數設為大於 20 的數字,則只會傳回 20 筆結果。如要取得更多結果,您需要傳送多項要求,並在每次要求時增加 start 參數值。

國際查詢和結果簡報

Google WebSearch 服務可讓您搜尋多種語言的文件。您可以指定要用來解讀 HTTP 要求及對 XML 回應編碼的字元編碼 (使用 ieoe 搜尋參數)。您也可以篩選結果,只顯示以特定語言撰寫的文件。

下列各節將討論使用多種語言搜尋的相關問題:

字元編碼

伺服器會以一連串編碼的位元組序列,將資料 (例如網頁) 傳送至使用者代理程式 (例如瀏覽器)。接著,使用者代理程式會將位元組解碼為字元序列。傳送要求至 WebSearch 服務時,您可以為搜尋查詢和收到的 XML 回應指定編碼配置。

您可以使用 ie 要求參數來指定 HTTP 要求中字元的編碼機制。您也可以使用 oe 參數指定 Google 應用來編碼 XML 回應的編碼配置。如果您使用 ISO-8859-1 (或 latin1) 以外的編碼配置,請務必為 ieoe 參數指定正確的值。

注意:如要為多種語言提供搜尋功能,建議您針對 ieoe 參數使用 utf8 (UTF-8) 編碼值。

如需可用於 ieoe 參數的完整值清單,請參閱字元編碼配置附錄。

如需更多有關字元編碼的一般資訊,請參閱 http://www.w3.org/TR/REC-html40/charset.html

介面語言

您可以使用 hl 要求參數來識別圖形介面的語言。如果未明確指定語言限制 (使用 lr 參數),hl 參數值就會影響 XML 搜尋結果,特別是在國際查詢中。在這種情況下,hl 參數可能會以與使用者輸入語言相同的語言宣傳搜尋結果。

建議您在搜尋結果中明確設定 hl 參數,確保 Google 為每項查詢選取最高品質的搜尋結果。

如需 hl 參數有效值的完整清單,請參閱「支援的介面語言」一節。

搜尋以特定語言撰寫的文件

您可以使用 lr 要求參數,將搜尋結果限制為以特定語言撰寫的文件,或以特定語言撰寫的文件。

lr 參數支援布林值運算子,讓您指定應 (或排除) 在搜尋結果中要包含或排除的多種語言。

以下範例說明如何使用布林值運算子要求不同語言的文件。

以日文撰寫的文件:

lr=lang_jp

以義大利文或德文撰寫的文件:

lr=lang_it|lang_de

非匈牙利文或捷克文撰寫的文件:

lr=(-lang_hu).(-lang_cs)

如需 lr 參數和布林值運算子一節的完整說明,請參閱「語言集合值」一節,瞭解這些運算子的完整用法。

簡體中文和繁體中文是中文的兩種書寫變體。同一個概念在每個變化版本中可能會以不同方式撰寫。如果查詢是其中一個變化版本,Google WebSearch 服務會傳回包含這兩種變化版本的網頁。

如要使用這項功能,請按照下列步驟操作:

  1. c2coff 要求參數設為 0
    ,然後
  2. 執行下列任一操作:
    • 請勿設定 lr 要求參數
    • lr 要求參數設為 lr=lang_zh-TW|lang_zh-CN

以下範例顯示以簡體中文和繁體中文產生結果的要求中,應包含的查詢參數。(請注意,範例中並未包含其他必要資訊,例如用戶端)。

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

篩選結果

Google WebSearch 提供多種篩選搜尋結果的方式:

自動篩選搜尋結果

為盡可能提供最準確的搜尋結果,Google 會使用以下兩種技術,將一般視為不適當的搜尋結果自動濾除:

  • 重複的內容:如有多份文件內含相同的資訊,則搜尋結果只會納入其中最相關的文件。

  • 主機密集占位 (Host Crowding) - 如有多筆搜尋結果來自同一個網站,Google 可能不會顯示該網站的所有搜尋結果,也可能顯示這類結果,其排名可能會低於

建議您為一般搜尋要求啟用這些篩選器,因為篩選器會大幅改善大部分搜尋結果的品質。不過,您可以在搜尋要求中將 filter 查詢參數設為 0,藉此略過這些自動篩選器。

語言和國家/地區篩選

Google WebSearch 服務會傳回所有網頁文件主索引中的結果。主索引會包含按照特定屬性 (包括語言和國家/地區) 分組的文件子集合。

您可以使用 lrcr 要求參數,將搜尋結果限制為分別以特定語言撰寫或源自特定國家/地區的文件子集合。

Google WebSearch 會分析以下項目,判斷文件語言:

  • 文件網址的頂層網域 (TLD)
  • 文件內的語言中繼標記
  • 文件內文使用的主要語言


如要進一步瞭解如何根據語言限制結果,另請參閱「搜尋」參數的定義、「搜尋以特定語言撰寫的文件」一節,以及可用來當做 lr 參數值的語言集合值

Google WebSearch 會分析以下項目,判斷文件所屬國家/地區:

  • 文件網址的頂層網域 (TLD)
  • 網路伺服器 IP 位址的地理位置

如要進一步瞭解如何依據來源國家/地區限制結果,請參閱 cr 參數的定義和可當做 cr 參數值的 Country Collection 值

注意:您可以結合語言值和國家/地區值,自訂搜尋結果。舉例來說,您可以要求以法文撰寫且來自法國或加拿大的文件,也可以要求來自荷蘭且非英文的文件。lrcr 參數都支援布林值運算子

使用安全搜尋過濾成人內容

許多 Google 客戶都不希望顯示含有成人內容的網站搜尋結果。您可以利用安全搜尋篩選器,過濾掉含有成人內容的搜尋結果,並予以刪除。 Google 的篩選器會使用獨家技術來檢查關鍵字、詞組和網址。雖然沒有任何篩選器能完全滴水不漏,但安全搜尋功能會將大部分的成人內容從搜尋結果中移除。

Google 致力於持續檢索網路,並結合使用者建議提供的更新內容,盡可能確保安全搜尋功能符合現況且全面。

安全搜尋支援下列語言:

荷蘭文
英文
法文
德文
義大利文
葡萄牙文 (巴西)
西班牙文
繁體中文

您可以使用 safe 查詢參數,調整 Google 篩選成人內容搜尋結果的程度。下表說明 Google 的安全搜尋設定,以及這些設定對搜尋結果的影響:

安全搜尋層級 說明
啟用更嚴格的安全搜尋功能。
媒介 封鎖含有色情內容和其他煽情露骨內容的網頁。
關閉 不會從搜尋結果中過濾掉成人內容。

* 安全搜尋設定預設為關閉

如果您已啟用安全搜尋,但在搜尋結果中發現含有令人反感內容的網站,請透過電子郵件將該網站的網址傳送至 safesearch@google.com,我們會著手調查該網站。

XML 結果

Google XML 結果 DTD

Google 會使用相同的 DTD 來說明所有類型搜尋結果的 XML 格式。許多標記和屬性都適用於所有搜尋類型。不過,部分標記僅適用於特定搜尋類型。因此 DTD 的定義可能比本文件中的定義更嚴格。

本文件說明 DTD 與 WebSearch 相關的面向。查看 DTD 時,如果您使用的是 WebSearch,可以放心忽略此處未記錄的標記和屬性。如果 DTD 和說明文件的定義不同,本文件中會說明這一點。

Google 會傳回 XML 結果,無論是否參照最新的 DTD。這份指南可協助搜尋管理員和 XML 剖析器瞭解 Google 的 XML 結果。Google XML 文法可能會不時變更,因此請不要將剖析器設為使用 DTD 來驗證每個 XML 結果。

此外,請勿設定 XML 剖析器在每次提交搜尋要求時擷取 DTD。Google 不常更新 DTD,這些要求會產生不必要的延遲和頻寬需求。

Google 建議您使用 xml_no_dtd 輸出格式來取得 XML 結果。如果您在搜尋要求中指定 xml output 格式,唯一的差別在於 XML 結果中加入下列這行程式碼:

<!DOCTYPE GSP SYSTEM "google.dtd">

您可以在 http://www.google.com/google.dtd 存取最新的 DTD。

請注意,目前可能無法使用或支援 DTD 的所有功能。

關於 XML 回應

  • 除非 XML 標記定義中另有註明,否則所有元素值都是適合顯示的有效 HTML。
  • 部分元素值是網址需要經過 HTML 編碼才能顯示。
  • XML 剖析器應忽略未記錄的屬性和標記。這樣一來,只要 Google 在 XML 輸出中加入更多功能,您的應用程式就能不修改而繼續運作。
  • 當某些字元新增為 XML 標記中的值時,必須逸出某些字元。您的 XML 處理器應將這些實體轉換回適當的字元。如果未正確轉換實體,瀏覽器可能會將 & 字元轉譯為「&amp;」。XML 標準記錄了這些字元,這些字元會重複出現在下表中:

    角色 逸出表單 實體 字元代碼
    連接符號 & &amp; &#38;
    單引號 ' &apos; &#39;
    雙引號 " &quot; &#34;
    大於 > &gt; &#62;
    小於 < &lt; &#60;

一般和進階搜尋查詢的 XML 結果

一般/進階搜尋:查詢範例和 XML 結果

這個範例 WebSearch 要求要求取得 10 筆與搜尋字詞「足球」(q=socer) 相關的結果 (num=10),在本範例中,系統刻意將「soccer」這個字詞拼寫錯誤。)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

這個要求會產生下方的 XML 結果。請注意,XML 結果中含有數則註解,以指出未包含在結果中的特定標記顯示的位置。

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

一般/進階搜尋:XML 標記

一般搜尋要求和進階搜尋要求的 XML 回應會使用同一組 XML 標記。上述 XML 標記如上表所示。

下列 XML 標記會依標記名稱的字母順序排列,每個標記定義都包含標記說明,以及標記在 XML 結果中的顯示方式和標記內容的格式。如果標記是其他 XML 標記的子標記,或者標記本身的子標記或屬性,系統也會在標記的定義表中提供該項資訊。

下列定義中的某些子標記旁邊可能會顯示某些符號,這些符號和它們的意義分別是:

? = 選用的子標記
* = 零個或多個子標記
+ = 一或多個子標記例項
A B C D F G H I L M N P Q R S T U X

anchor_text
定義

<anchor_text> 標記可用來指定您應該向使用者顯示的文字,用來識別與搜尋結果集相關聯的修正標籤。由於修正標籤會將非英數字元以底線取代,因此不應在使用者介面中顯示 <label> 標記的值。您應該改為顯示 <anchor_text> 標記的值。

範例 <anchor_text>高爾夫球場</anchor_text>
子標記 FacetItem
內容格式 文字

封鎖
定義

這個標記可在促銷活動結果的內文中封裝區塊的內容。每個區塊都有 TUL 子標記。非空白的 T 標記表示區塊包含文字;非空白的 UL 標記表示區塊包含連結 (透過 U 子標記指定的網址和 L 子標記中的錨定文字)。

子標記 TUL
子標記 BODY_LINE
內容格式 空白

BODY_LINE
定義

這個標記會在宣傳結果的主體中封裝其中一行的內容。每一行內文都包含數個 BLOCK 標記,其中包含一些文字,或是含有網址和錨定文字的連結。

子標記 封鎖*
子標記 SL_MAIN
內容格式 空白

C
定義

<C> 標記表示 WebSearch 服務可以擷取這個搜尋結果網址的快取版本。您無法透過 XML API 擷取快取網頁,但可將使用者重新導向至 www.google.com 中的內容。

Attributes
名稱 形式 說明
SZ 文字 (整數 +「k」) 以 KB 為單位提供搜尋結果的快取版本大小。
CID 文字 在 Google 快取中找出文件。 如要從快取擷取文件,請傳送以下列格式建構的搜尋字詞:
cache:CIDtext:escapedURL

逸出網址可在 UE 標記中使用。

範例 <C SZ="6k" CID="kvOXK_cYSSgJ" />
子標記 HAS
內容格式 空白

C2C
定義 <C2C> 標記表示結果是指繁體中文網頁。只有在啟用簡體中文搜尋和繁體中文搜尋時,系統才會顯示這個標記。如要進一步瞭解如何啟用及停用這項功能,請參閱 c2coff 查詢參數定義。
內容格式 文字

情境
定義

<Context> 標記內含與一組搜尋結果相關聯的分類標籤清單。

範例 <Context>
子標記 titleFacet+
內容格式 容器

擷取日期
定義

<CRAWLDATE> 標記代表上次檢索網頁的日期。並非所有搜尋結果網頁都會傳回 CRAWLDATE

範例 <CRAWLDATE>2005 年 5 月 21 日</CRAWLDATE>
子標記 R
內容格式 文字

DI
定義

<DI> 標記會封裝單一搜尋結果的開放式目錄專案 (ODP) 類別資訊。

範例 <DI>
子標記 DT?、DS
子標記 HAS
內容格式 空白

DS
定義

<DS> 標記提供 ODP 目錄中單一類別的摘要。

範例 <DS>請直接在網路上發布你的 &lt;b&gt;soccer&lt;/b&gt;。</DS>
子標記 DI
內容格式 文字 (可包含 HTML)

DT:裝置樹狀架構
定義

<DT> 標記可為 ODP 目錄中列出的單一類別提供標題。

範例 <DT>SoccerConnection.net</DT>
子標記 DI
內容格式 文字 (可包含 HTML)

facet
定義

<Facet> 標記包含 <FacetItem> 標記的邏輯分組。您可以使用程式化搜尋引擎 XML 規格格式建立這些分組。如未建立這些分組,results_xml_tag_Context><Context> 標記最多可包含四個 <Facet> 標記。每個 <Facet> 標記內的項目都會依顯示目的進行分組,但可能沒有邏輯關係。

範例 <Facet>
子標記 FacetItem +、title+
子標記 背景資訊
內容格式 容器

FacetItem
定義

<FacetItem> 標記內含與一組搜尋結果相關聯的修正標籤相關資訊。

範例 <FacetItem>
子標記 labelanchor_text+
子標記 Facet
內容格式 FacetItem

芬蘭
定義 <FI> 標記可做為標記,指出系統是否對搜尋執行文件篩選。如要進一步瞭解 Google 搜尋結果篩選器,請參閱本文件的「自動篩選」一節。
範例 <FI />
子標記 反抗軍
內容格式 空白

GSP
定義

<GSP> 標記會封裝 Google XML 搜尋結果傳回的所有資料。「GSP」是「Google 搜尋通訊協定」的縮寫。

Attributes
名稱 形式 說明
常見 文字 (整數) VER 屬性可指定搜尋結果的輸出版本。目前的輸出版本為「3.2」。
範例 <GSP VER="3.2">
子標記 PARAM+、QRES?、TM
內容格式 空白

HAS
定義 <HAS> 標記會封裝特定網址支援的任何特殊搜尋要求參數相關資訊。

注意:WebSearch 的 <HAS> 定義比 DTD 更嚴格。

子標記 DI?、L?、C?、RT 嗎?
子標記 R

ISURL
定義 如果相關聯的搜尋查詢為網址,Google 就會傳回 <ISURL> 標記。
子標記 GSP
內容格式 空白

L
定義 出現 <L> 標記時,表示 WebSearch 服務找到其他連結至這個搜尋結果網址的網站。如要找出這類網站,請使用 link: 特殊查詢字詞。
子標記 HAS
內容格式 空白

標籤
定義

<label> 標記可指定修正標籤,您可以使用這個標籤篩選收到的搜尋結果。如要使用修正標籤,請將字串 more:[[label tag value]] 加進 HTTP 要求中 q 參數值,如以下範例所示。請注意,這個值必須先逸出網址,才能將查詢傳送給 Google。

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

注意:<label> 標記與 <Label> 標記不同,後者是用來識別與搜尋結果中特定網址相關聯的分類標籤。

範例 <label>高爾夫球場</label>
子標記 FacetItem
內容格式 文字

LANG
定義

<LANG> 標記包含 Google 最接近搜尋結果的語言。

範例 <LANG>en</LANG>
子標記 R
內容格式 文字

M
定義

<M> 標記可識別搜尋的預估結果總數。

注意: 這項預估值可能不準確。

範例 <M>16200000</M>
子標記 反抗軍
內容格式 文字

新生兒
定義

<NB> 標記會封裝結果集的導覽資訊 (指向下一頁或搜尋結果的上一頁連結)。

注意:如有更多結果,系統才會顯示這個標記。

範例 <NB>
子標記 NU?、PU
子標記 反抗軍
內容格式 空白

NU
定義

<NU> 標記包含前往下一頁搜尋結果的相對連結。

範例 <NU>/search?q=flowers&num=10&hl=zh-TW&ie=UTF-8
&output=xml&client=test&start=10</NU>
子標記 新生兒
內容格式 文字 (相對網址)

PARAM
定義

<PARAM> 標記可識別在與 XML 結果相關聯的 HTTP 要求中提交的輸入參數。參數相關資訊包含在標記屬性 (name、value、original_value) 中,且在 HTTP 要求中提交的每個參數都會有一個 PARAM 標記。

Attributes
名稱 形式 說明
name 文字 輸入參數名稱。
value HTML HTML 格式版本的輸入參數值。
original_value 文字 輸入參數值的原始網址逸出版本。
範例 <PARAM name="cr" value="countryNZ" original_value="countryNZ" />
子標記 GSP
內容格式 複合式

處理單元
定義

<PU> 標記可提供與上一頁的相對連結。

範例 <PU>/search?q=flowers&num=10&hl=zh-TW&output=xml
&client=test&start=10</PU>
子標記 新生兒
內容格式 文字 (相對網址)

Q
定義

<Q> 標記可識別在與 XML 結果相關聯的 HTTP 要求中提交的搜尋查詢。

範例

<Q>pizza</Q>

子標記 GSP
內容格式 文字

R
定義

<R> 標記會封裝個別搜尋結果的詳細資料。

注意:WebSearch 的 <R> 標記定義比 DTD 更嚴格,

Attributes
名稱 形式 說明
N 文字 (整數) 指出這項搜尋結果的索引 (從 1 開始計算)。
MIME 文字 指出搜尋結果的 MIME 類型。
子標記 UUET?、CRAWLDATES?、LANGHAS
子標記 反抗軍

反抗軍
定義

<RES> 標記會封裝個別搜尋結果集和與這些結果相關的詳細資料。

Attributes
名稱 形式 說明
SN 文字 (整數) 指出這個結果集中傳回第一筆搜尋結果的索引 (從 1 開始)。
zh-TW 文字 (整數) 指出這個結果集傳回的最後搜尋結果索引 (從 1 開始)。
範例 <RES SN="1" EN="10">
子標記 MFI?、XT?、NB?、R*
子標記 GSP
內容格式 空白

定義

<S> 標記包含搜尋結果摘錄,其中顯示以粗體強調的查詢字詞。您的摘錄中會包含換行符號,以便適當的文字換行。

範例 <S>華盛頓州 (CNN) -- 採用一種出價方式,為結束參議員與總統與 大四、Bush&#39;s&lt;/b&gt;/b&gt;/b&gt;司法選擇, 讓五名入圍者晉級最後投票,同時保留 &lt;b&gt;...&lt;b&gt;...
子標記 R
內容格式 文字 (HTML)

SL_MAIN
定義

這個標記會封裝促銷活動結果的內容。用於剖析促銷活動。標題連結的錨定文字和網址會分別包含在 TU 子標記中。內文和連結包含在 BODY_LINE 子標記中。

子標記 BODY_LINE*、TU
子標記 SL_RESULTS
內容格式 空白

SL_RESULTS
定義

推薦結果的容器標記。搜尋結果中有促銷活動時,系統會顯示其中一個選項。SL_MAIN 子標記包含主要結果資料。

子標記 SL_MAIN*
子標記 R
內容格式 空白

拼字
定義

<Spelling> 標記會封裝所提交查詢的其他拼字建議。這個標記只會顯示在搜尋結果的第一頁。拼字建議功能支援英文、中文、日文和韓文。

注意:如果 gl 參數值為小寫,Google 只會為查詢傳回拼字建議。

範例 <Spelling>
子標記 建議
子標記 GSP
內容格式 空白

建議
定義 <suggestion> 標記包含提交的查詢其他拼字建議。您可以使用標記內容,為搜尋使用者建議其他拼法。q 屬性的值是網址逸出的拼字建議,可以做為查詢字詞。
Attributes
名稱 格式 說明
文字 q 屬性可指定拼字建議的「網址逸出」版本。
範例 <建議 q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Suggestion>
子標記 拼字
內容格式 文字 (HTML)

T
定義 <T> 標記包含結果的標題。
範例 <T>阿米奇東岸 披薩店</T>
子標記 R
內容格式 文字 (HTML)

title
定義

<title> 標記是 <Context> 的子標記,其中包含程式化搜尋引擎的名稱。

<Facet> 的子項中,<title> 標記提供了一組 facet 的標題。

範例

身為 <Context> 的孩子:<title>我的搜尋引擎</title>

這是 <Facet> 的子項:<title>facet title</title>

子標記 ContextFacet
內容格式 文字

TM
定義

<TM> 標記可指出傳回搜尋結果所需的總伺服器時間 (以秒為單位)。

範例 <TM>0.100445</TM>
子標記 GSP
內容格式 文字 (浮點數)

TT
定義 <TT> 標記提供搜尋提示。
範例 <TT>&lt;i&gt;提示:在大多數瀏覽器中,按下 Return 鍵會產生與點選「搜尋」按鈕相同的結果。&lt;/i&gt;</TT>
子標記 GSP

U
定義 <U> 標記會提供搜尋結果的網址。
範例 <U>http://www.dominos.com/</U>
子標記 R
內容格式 文字 (絕對網址)

烏拉圭
定義

<UD> 標記會提供搜尋結果的 IDN 編碼 (國際網域名稱) 網址。這個值可讓網域以當地語言顯示。舉例來說,經過 IDN 編碼的網址 http://www.%E8%8A%B1%E4%BA%95.com 可能會經過解碼,並以 http://www.GOibtech.com 表示。只有在要求包含 ud 參數的要求時,這個 <UD> 標記才會出現在搜尋結果中。

注意:這是 Beta 版功能,

範例 <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
子標記 R
內容格式 文字 (IDN 編碼的網址)

UE
定義 <UE> 標記會提供搜尋結果的網址。這個值是網址逸出,因此適合在網址中做為查詢參數傳遞。
範例 <UE>http://www.dominos.com/</UE>
子標記 R
內容格式 文字 (網址逸出的網址)

XT 軸
定義 <XT> 標記表示預估的結果總數 (透過 M 標記指定) 實際上代表確切的結果總數。詳情請參閱本文件的「自動篩選」一節。
範例 <XT />
子標記 反抗軍
內容格式 空白


圖片搜尋查詢的 XML 結果

這個範例圖片要求要求取得 5 筆關於「猴子」搜尋字詞的結果 (num=5)。

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

這個要求會產生下方的 XML 結果。


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

圖片搜尋:XML 標記

下表顯示在圖片搜尋查詢的 XML 回應中使用的其他 XML 標記。

下列定義中的某些子標記旁邊可能會顯示某些符號,這些符號和它們的意義分別是:

? = 選用的子標記
* = 零個或多個子標記
+ = 一或多個子標記例項

羅馬尼亞列伊
定義

<RG> 標記包含個別圖片搜尋結果的詳細資料。

Attributes
名稱 形式 說明
N 文字 (整數) 指出這項搜尋結果的索引 (從 1 開始計算)。
MIME 文字 指出搜尋結果的 MIME 類型。
子標記 反抗軍
RU
定義

<RU tag> 標記內含每個圖片搜尋結果的詳細資料。

子標記 R