XML API リファレンス

このページでは、カスタム検索 JSON API の XML バージョンについて説明します。このバージョンは、Google サイト内検索のお客様のみが利用できます。

  1. 概要
  2. プログラム可能検索エンジンのリクエスト形式
    1. リクエストの概要
    2. クエリ語句
    3. リクエスト パラメータ
      1. WebSearch クエリの例
      2. WebSearch クエリ パラメータの定義
      3. 検索オプション
      4. 検索オプションのクエリ パラメータ
      5. 特別な検索キーワード
      6. 画像クエリの例
      7. 画像検索のクエリ パラメータ
      8. リクエストの制限
    4. クエリと結果のプレゼンテーションの国際化
      1. 文字エンコード
      2. インターフェースの言語
      3. 中国語(簡体字と繁体字)の検索
    5. 結果のフィルタリング
      1. 検索結果の自動フィルタリング
      2. 言語と国のフィルタリング
      3. セーフサーチでアダルト コンテンツをフィルタする
  3. XML の結果
    1. Google XML 検索結果 DTD
    2. XML レスポンスについて
    3. 通常の検索クエリ、画像検索クエリ、高度な検索クエリの XML 結果
      1. 通常の検索/高度な検索: クエリと XML 結果の例
      2. 通常検索/検索オプション: XML タグ
      3. 画像検索クエリの XML 結果
      4. 画像検索: クエリの例と XML の結果
      5. 画像検索: XML タグ

概要

Google ウェブ検索サービスを使用すると、Google サイト内検索のお客様は、ご自身のウェブサイトに Google 検索の結果を表示できます。WebSearch サービスは、単純な HTTP ベースのプロトコルを使用して検索結果を提供します。検索管理者は、検索結果をリクエストする方法と、エンドユーザーに検索結果を表示する方法を完全に制御できます。このドキュメントでは、Google 検索リクエストと結果の形式の技術的な詳細について説明します。

Google ウェブ検索の結果を取得するには、アプリから Google に簡単な HTTP リクエストを送信します。Google は検索結果を XML 形式で返します。XML 形式の結果を使用すると、検索結果の表示方法をカスタマイズできます。

WebSearch リクエストの形式

リクエストの概要

Google 検索リクエストは標準の HTTP GET コマンドです。クエリに関連するパラメータのコレクションが含まれます。これらのパラメータは、リクエスト URL に名前と値のペアとして含まれ、アンパサンド(&)で区切られます。パラメータには、検索クエリなどのデータや、HTTP リクエストを送信しているエンジンを識別する一意のエンジン ID(cx)が含まれます。WebSearch サービスまたは Image Search サービスは、HTTP リクエストに応じて XML 結果を返します。

クエリ語句

ほとんどの検索リクエストには、1 つ以上のクエリ用語が含まれています。検索リクエストのパラメータの値として検索語句が表示されます。

クエリ用語では、Google が返す検索結果をフィルタして整理するために、いくつかの種類の情報を指定できます。クエリでは、次のものを指定できます。

  • 含めるまたは除外する単語やフレーズ
    • 検索クエリ内のすべての単語(デフォルト)
    • 検索クエリ内の完全一致フレーズ
    • 検索クエリ内の任意の単語またはフレーズ
  • ドキュメントのどこで検索語句を探すか
    • ドキュメント全体(デフォルト)
    • ドキュメント内のリンクのみ
  • ドキュメント自体に関する制限
    • 特定のファイル形式(PDF ファイルや Word ドキュメントなど)のドキュメントを含めるか除外するか
  • 検索ではなく、特定の URL に関する情報を返す特別な URL クエリ
    • URL に関する一般的な情報(Open Directory のカテゴリ、スニペット、言語など)を返すクエリ
    • URL にリンクしているウェブページのセットを返すクエリ
    • 指定された URL に類似した一連のウェブページを返すクエリ

デフォルトの検索

検索クエリ パラメータ値は URL エスケープする必要があります。検索クエリ内の空白文字のシーケンスはプラス記号(「+」)に置き換えます。これについては、このドキュメントの URL エスケープのセクションで詳しく説明します。

検索クエリ語句は、q パラメータを使用して WebSearch サービスに送信されます。検索クエリ語句の例は次のとおりです。

q=horses+cows+pigs

デフォルトでは、Google WS サービスは検索クエリ内のすべての用語を含むドキュメントのみを返します。

リクエスト パラメータ

このセクションでは、検索リクエストを行うときに使用できるパラメータを一覧表示します。パラメータは 2 つのリストに分割されます。最初のリストには、すべての検索リクエストに関連するパラメータが含まれています。2 つ目のリストには、高度な検索リクエストにのみ関連するパラメータが含まれています。

次の 3 つのリクエスト パラメータが必要です。

  • client パラメータを google-csbe に設定する必要があります。
  • output パラメータは、返される XML 結果の形式を指定します。結果は、Google の DTD への参照あり(xml)または参照なし(xml_no_dtd)で返されます。この値は xml_no_dtd に設定することをおすすめします。注: このパラメータを指定しない場合、結果は XML ではなく HTML で返されます。
  • エンジンの一意の ID を表す cx パラメータ。

上記以外の最もよく使用されるリクエスト パラメータは次のとおりです。

  • num - リクエストされた検索結果の数
  • q - 検索キーワード
  • start - 結果の開始インデックス

WebSearch クエリの例

次の例は、さまざまなクエリ パラメータの使用方法を示す WebSearch HTTP リクエストの例です。さまざまなクエリ パラメータの定義については、このドキュメントのウェブ検索クエリ パラメータの定義高度な検索クエリ パラメータのセクションをご覧ください。

このリクエストは、クエリ語句「red sox」(q=red+sox)の最初の 10 件の結果(start=0&num=10)をリクエストしています。また、結果はカナダのウェブサイト(cr=countryCA)から取得し、フランス語(lr=lang_fr)で記述する必要があることも指定しています。最後に、clientoutputcx の各パラメータの値も指定しています。これら 3 つのパラメータはすべて必須です。

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

この例では、高度な検索クエリ パラメータの一部を使用して、検索クエリをさらにカスタマイズしています。このリクエストでは、q パラメータの代わりに as_q パラメータ(as_q=red+sox)を使用しています。また、as_eq パラメータを使用して、「Yankees」という単語を含むドキュメントを検索結果から除外しています(as_eq=yankees)。

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

WebSearch クエリ パラメータの定義

c2coff
説明

(省略可)c2coff パラメータは、簡体字中国語と繁体字中国語の検索機能を有効または無効にします。

このパラメータのデフォルト値は 0(ゼロ)です。これは、この機能が有効になっていることを意味します。c2coff パラメータの値は次のとおりです。

アクション
1 無効
0 有効
q=google&c2coff=1

クライアント
説明

必須client パラメータを google-csbe に設定する必要があります。

q=google&client=google-csbe

cr
説明

(省略可)cr パラメータは、検索結果を特定の国のドキュメントに制限します。cr パラメータの値でブール演算子を使用できます。

Google WS はドキュメントの国を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ウェブサーバーの IP アドレスの地理的位置

このパラメータに使用できる値の一覧については、国(cr)パラメータの値のセクションをご覧ください。

q=Frodo&cr=countryNZ

cx
説明

必須cx パラメータは、カスタム検索エンジンを識別する一意のコードを指定します。cx パラメータを使用してプログラム可能検索エンジンを指定し、そのエンジンから検索結果を取得する必要があります。

cx パラメータの値を確認するには、エンジンの [コントロール パネル] > [コード] タブに移動します。この値は、[Paste this code in the page where you'd like your search box to appear. 検索結果は Google でホストされるページに表示されます。」

q=Frodo&cx=00255077836266642015:u-scht7a-8i

filter
説明

(省略可)filter パラメータは、Google 検索結果の自動フィルタリングを有効または無効にします。Google の検索結果フィルタについて詳しくは、このドキュメントの自動フィルタリングのセクションをご覧ください。

filter パラメータのデフォルト値は 1 です。これは、機能が有効になっていることを示します。このパラメータの有効な値は次のとおりです。

アクション
1 無効
0 有効

注: デフォルトでは、Google はすべての検索結果にフィルタを適用して、検索結果の品質を向上させています。

q=google&filter=0

gl
説明

(省略可)gl パラメータの値は 2 文字の国コードです。WebSearch の結果の場合、gl パラメータは、原産国がパラメータ値と一致する検索結果をブーストします。有効な値のリストについては、「国コード」のセクションを参照してください。

WebSearch リクエストで gl パラメータ値を指定すると、結果の関連性が向上します。これは、特に海外のお客様、さらに具体的には、米国以外の英語圏のお客様に当てはまります。

このリクエストは、英国で作成されたドキュメントを WebSearch の結果でブーストします。
q=pizza&gl=uk


hl
説明

(省略可)hl パラメータは、ユーザー インターフェースのインターフェース言語(ホスト言語)を指定します。検索結果のパフォーマンスと品質を向上させるには、このパラメータを明示的に設定することを強くおすすめします。

詳細については、クエリと結果の表示の国際化インターフェース言語セクションをご覧ください。サポートされている言語の一覧については、サポートされているインターフェース言語をご覧ください。

このリクエストは、フランス語のワインの広告を対象としています(Vin はフランス語でワインを意味します)。

q=vin&ip=10.10.10.10&ad=w5&hl=fr

hq
説明

(省略可)hq パラメータは、指定されたクエリ語句を、論理 AND 演算子で結合されたかのようにクエリに追加します。

このリクエストは「pizza」と「cheese」を検索します。式は q=pizza+cheese と同じです。

q=pizza&hq=cheese


ie
説明

(省略可)ie パラメータでは、クエリ文字列を解釈するために使われる文字エンコード スキームを設定します。デフォルトの ie 値は latin1 です。

このパラメータの使用が必要になる場合については、文字エンコードのセクションをご覧ください。

ie に指定できる値のリストについては、「文字エンコード スキーム」セクションをご覧ください。

q=google&ie=utf8&oe=utf8
lr
説明

(省略可)lr(言語の制限)パラメータは、検索結果を特定の言語で作成されたドキュメントに制限します。

Google WS はドキュメントの言語を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ドキュメント内の言語メタタグ
  • ドキュメントの本文で使用される主な言語
  • ドキュメントの本文で使用される補助言語(ある場合)

このパラメータの有効な値の一覧については、言語(lr)コレクションの値のセクションをご覧ください。

q=Frodo&lr=lang_en

num
説明

(省略可)num パラメータは、返す検索結果の数を指定します。

デフォルトの num 値は 10、最大値は 20 です。20 件を超える結果をリクエストした場合、20 件の結果のみが返されます。

注: 検索結果の合計数がリクエストされた結果の数よりも少ない場合は、利用可能なすべての検索結果が返されます。

q=google&num=10

oe
説明

(省略可)oe パラメータでは、XML 結果をデコードするために使用する文字エンコード スキームを設定します。デフォルトの oe 値は latin1 です。

このパラメータの使用が必要になる場合については、文字エンコードのセクションをご覧ください。

oe に指定できる値のリストについては、「文字エンコード スキーム」セクションをご覧ください。

q=google&ie=utf8&oe=utf8

output
説明

必須output パラメータは、XML 結果の形式を指定します。このパラメータで有効な値は xmlxml_no_dtd のみです。次の表に、これらのパラメータ値の違いを示します。

出力形式
xml_no_dtd XML 結果には !DOCTYPE ステートメントは含まれません。(推奨)
xml XML の結果には、Google DTD 参照が含まれます。結果の 2 行目は、結果で使用されるドキュメント定義タイプ(DTD)を示します。
    <!DOCTYPE GSP SYSTEM "google.dtd">
output=xml_no_dtd
output=xml

q
説明

(省略可)q パラメータは、ユーザーが入力した検索クエリを指定します。このパラメータは省略可能ですが、検索結果を取得するには、クエリ パラメータ(as_epqas_lqas_oqas_q)の少なくとも 1 つに値を指定する必要があります。

q パラメータの値の一部として使用できる特別なクエリ用語も多数あります。これらの用語のリストと定義については、特別なクエリ用語をご覧ください。

Google 検索コントロール パネルには、q パラメータを使用して送信された上位のクエリのレポートが含まれています。

注: q パラメータに指定する値は、URL エスケープされている必要があります。

q=vacation&as_oq=london+paris

安全性
説明

(省略可)safe パラメータは、アダルト コンテンツやポルノ コンテンツの検索結果をどのようにフィルタリングするかを示します。safe パラメータのデフォルト値は off です。有効なパラメータ値は次のとおりです。

アクション
off セーフサーチを無効にする
medium セーフサーチを有効にする
high セーフサーチの厳格モードを有効にする

この機能について詳しくは、セーフサーチでアダルト コンテンツをフィルタするをご覧ください。

q=adult&safe=high

start
説明

(省略可)start パラメータは、検索結果に含める最初の一致結果を示します。start パラメータは 0 から始まるインデックスを使用します。つまり、最初の結果は 0、2 番目の結果は 1 となります。

start パラメータは、num パラメータと組み合わせて、どの検索結果を返すかを決定します。クエリに一致するドキュメントが 1,000 件を超えていても、返される結果は 1,000 件までです。そのため、start を 1,000 以上に設定しても結果は返されません。

start=10

並べ替え
説明

(省略可)sort パラメータは、指定された式に従って結果を並べ替えることを指定します。たとえば、日付順に並べ替えます。

sort=date


ud
説明

(省略可)ud パラメータは、検索結果の IDN エンコードされた URL を XML レスポンスに含めるかどうかを示します。IDN(国際化ドメイン名)エンコードを使用すると、ドメインをローカル言語で表示できます。例:

http://www.花井鮨.com

このパラメータの有効な値は 1(デフォルト)と 0 です。1 は、XML 結果に IDN エンコードされた URL を含めることを意味し、0 は、XML 結果に IDN エンコードされた URL を含めないことを意味します。ud パラメータが 1 に設定されている場合、IDN エンコードされた URL は XML 結果の UD タグに表示されます。

ud パラメータが 0 に設定されている場合、上記の例の URL は次のように表示されます。

http://www.xn--elq438j.com.

注: これはベータ版の機能です。

q=google&ud=1

画像の下に記載されている追加のクエリ パラメータは、高度な検索クエリに関連しています。高度な検索を送信すると、複数のパラメータ(as_eqas_epqas_oq など)の値がすべて、その検索のクエリ語句に反映されます。画像は、Google の高度な検索ページを示しています。画像では、各高度な検索パラメータの名前が、そのパラメータに対応するページのフィールドの内側または横に、赤色のテキストで記載されています。



高度な検索クエリ パラメータ

as_dt
説明

(省略可)as_dt パラメータは、as_sitesearch パラメータで指定されたサイトの結果を含めるか除外するかを制御します。値 i は包含、値 e は除外をそれぞれ示します。

as_dt=i,as_dt=e

as_epq
説明

(省略可)as_epq パラメータは、検索結果のすべてのドキュメントに含まれている必要があるフレーズを指定します。フレーズ検索のクエリ用語を使用してフレーズを検索することもできます。

as_epq=abraham+lincoln

as_eq
説明

(省略可)as_eq パラメータは、検索結果のドキュメントに表示されないようにする単語またはフレーズを指定します。除外クエリ用語を使用して、特定の単語やフレーズが検索結果セットのドキュメントに表示されないようにすることもできます。

q=bass&as_eq=music


as_lq
説明

(省略可)as_lq パラメータは、すべての検索結果に特定の URL へのリンクを含めることを指定します。このタイプのクエリには、link: クエリ用語を使用することもできます。

as_lq=www.google.com


as_nlo
説明

(省略可)as_nlo パラメータは、検索範囲の開始値を指定します。as_nloas_nhi を使用して、as_nlo...as_nhi の包括的な検索範囲をクエリに追加します。

次の例では、検索範囲を 5 ~ 10(両端を含む)に設定します。

as_nlo=5&as_nhi=10

as_nhi
説明

(省略可)as_nhi パラメータは、検索範囲の終了値を指定します。as_nloas_nhi を使用して、as_nlo...as_nhi の包括的な検索範囲をクエリに追加します。

次の例では、検索範囲を 5 ~ 10(両端を含む)に設定します。

as_nlo=5&as_nhi=10

as_oq
説明

(省略可)as_oq パラメータは、ドキュメントで確認する追加の検索キーワードを指定します。検索結果の各ドキュメントには、追加の検索キーワードの少なくとも 1 つが含まれている必要があります。このタイプのクエリには、ブール値の OR クエリ用語を使用することもできます。

q=vacation&as_oq=London+Paris


as_q
説明

(省略可)as_q パラメータには、ドキュメント内でチェックする検索キーワードを指定します。このパラメータは、ユーザーが検索結果のセット内で検索する追加のキーワードを指定できるようにするためにもよく使用されます。

q=president&as_q=John+Adams


as_qdr
説明

(省略可)as_qdr パラメータは、指定された期間(クイック日付範囲)の検索結果をリクエストします。サポートされる値は次のとおりです。

d[number] は、指定された過去の日数の結果をリクエストします。
w[number] は、指定された過去の週数から結果をリクエストします。
m[number] は、指定された過去の月数の結果をリクエストします。
y[number] は、指定された過去の年数から結果をリクエストします。

この例では、過去 1 年間の結果をリクエストしています。

as_qdr=y

この例では、過去 10 日間の結果をリクエストします。

as_qdr=d10

as_sitesearch
説明

(省略可)as_sitesearch パラメータを使用すると、すべての検索結果が特定のサイトのページになるように指定できます。as_dt パラメータを設定すると、特定のサイトのページを検索結果から除外することもできます。

q=vacation&as_sitesearch=www.google.com


特別な検索キーワード

Google ウェブ検索では、Google 検索エンジンの追加機能にアクセスするいくつかの特別なクエリ用語を使用できます。これらの特別なクエリ用語は、q リクエスト パラメータの値に含める必要があります。他のクエリ用語と同様に、特殊なクエリ用語も URL エスケープする必要があります。特殊なクエリ語句の多くにはコロン(:)が含まれています。この文字も URL エスケープする必要があります。URL エスケープされた値は %3A です。

バックリンク [link:]
説明

link: クエリ用語は、特定の URL にリンクしているウェブページのセットを取得します。検索クエリは link:URL の形式で、link: クエリ用語と URL の間にスペースを入れないようにします。

link: の URL エスケープ バージョンは link%3A です。

as_lq リクエスト パラメータを使用して link: リクエストを送信することもできます。

注: link: を使用する場合は、他のクエリ用語を指定できません。

http://www.google.com/search?q=link%3Awww.example.com


ブール値 OR 検索 [ OR ]
説明

OR クエリ用語は、一連の(2 つ以上の)クエリ用語のいずれかを含むドキュメントを取得します。OR クエリ用語を使用するには、一連の用語の間に大文字の検索用語 OR を挿入します。

as_oq リクエスト パラメータを使用して、一連の語句に含まれる任意の語句の検索を送信することもできます。

注: 検索リクエストでクエリ「London+OR+Paris」が指定されている場合、検索結果には、これらの 2 つの単語の少なくとも 1 つを含むドキュメントが含まれます。場合によっては、検索結果のドキュメントに両方の単語が含まれていることがあります。

ロンドンまたはパリを検索する:

ユーザー入力:london OR paris クエリ用語:q=london+OR+paris

「休暇」と「ロンドン」または「パリ」を検索します。

クエリ用語:q=vacation+london+OR+paris

「vacation」と「London」、「Paris」、「chocolates」のいずれかを検索します。

クエリ用語:  q=vacation+london+OR+paris+OR+chocolates

「vacation」と「chocolates」を検索し、「london」または「paris」のいずれかを含めます。重み付けは「chocolates」を最小にします。

クエリ用語:  q=vacation+london+OR+paris+chocolates

「London」または「Paris」を含むドキュメントで、「vacation」、「chocolates」、「flowers」を検索します。

クエリ用語:  q=vacation+london+OR+paris+chocolates+flowers

「休暇」と「ロンドン」または「パリ」のいずれかを検索し、さらに「チョコレート」または「花」のいずれかを検索します。

クエリ用語:  q=vacation+london+OR+paris+chocolates+OR+flowers

除外キーワード [-]
説明

除外(-)クエリ用語は、特定の検索リクエストの結果を、特定の単語やフレーズを含まないドキュメントに制限します。除外クエリ用語を使用するには、一致するドキュメントから除外する単語またはフレーズの前に「-」(マイナス記号)を付けます。

- の URL エスケープ バージョンは %2D です。

除外クエリ語句は、検索語句に複数の意味がある場合に便利です。たとえば、「bass」という単語は、魚または音楽に関する結果を返す可能性があります。魚に関するドキュメントを探している場合は、除外クエリ用語を使用して、音楽に関するドキュメントを検索結果から除外できます。

as_eq リクエスト パラメータを使用して、特定の単語やフレーズに一致するドキュメントを検索結果から除外することもできます。

ユーザー入力: bass -music
クエリ用語: q=bass+%2Dmusic

ファイル形式の除外 [ -filetype: ]
説明

-filetype: クエリ用語は、特定のファイル拡張子(「.pdf」や「.doc」など)を持つドキュメントを検索結果から除外します。検索クエリは -filetype:EXTENSION の形式で指定します。-filetype: クエリ用語と指定された拡張機能の間にスペースは入れません。

-filetype: の URL エスケープ バージョンは %2Dfiletype%3A です。

注: クエリに -filetype: クエリ用語を追加すると、複数のファイル形式を検索結果から除外できます。検索結果から除外するファイル拡張子ごとに、検索クエリに 1 つの -filetype: クエリ用語を含める必要があります。

Google でサポートされているファイル形式は次のとおりです。

  • Adobe Portable Document Format(pdf)
  • Adobe PostScript(ps)
  • Lotus 1-2-3(wk1、wk2、wk3、wk4、wk5、wki、wks、wku)
  • Lotus WordPro(lwp)
  • Macwrite(mw)
  • Microsoft Excel(.xls)
  • Microsoft PowerPoint(.ppt)
  • Microsoft Word(.doc)
  • Microsoft Works(wks、wps、wdb)
  • Microsoft Write(wri)
  • リッチ テキスト形式(rtf)
  • Shockwave Flash(swf)
  • テキスト(ans、txt)。

今後、ファイル形式が追加される可能性があります。最新のリストは、Google のファイル形式に関するよくある質問で確認できます。

この例では、「Google」という単語が含まれているが、PDF ドキュメントではないドキュメントを返します。
q=Google+%2Dfiletype%3Apdf

この例では、「Google」という単語を含むドキュメントを返しますが、PDF ドキュメントと Word ドキュメントの両方を除外します。
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


ファイル形式のフィルタリング [ filetype: ]
説明

filetype: クエリ語句は、検索結果を特定のファイル拡張子(「.pdf」や「.doc」など)のドキュメントに制限します。検索クエリは filetype:EXTENSION の形式で指定する必要があります。filetype: クエリ語句と指定された拡張子の間にスペースは入れません。

filetype: の URL エスケープ バージョンは filetype%3A です。

検索結果を、複数のファイル拡張子のいずれかに一致するドキュメントに制限するには、クエリに filetype: クエリ用語を追加します。検索結果に含めるファイル拡張子ごとに、検索クエリに 1 つの filetype: クエリ用語を含める必要があります。複数の filetype: クエリ用語は、OR クエリ用語で区切る必要があります。

デフォルトでは、検索結果には任意のファイル拡張子のドキュメントが含まれます。

Google でサポートされているファイル形式は次のとおりです。

  • Adobe Portable Document Format(pdf)
  • Adobe PostScript(ps)
  • Lotus 1-2-3(wk1、wk2、wk3、wk4、wk5、wki、wks、wku)
  • Lotus WordPro(lwp)
  • Macwrite(mw)
  • Microsoft Excel(.xls)
  • Microsoft PowerPoint(.ppt)
  • Microsoft Word(.doc)
  • Microsoft Works(wks、wps、wdb)
  • Microsoft Write(wri)
  • リッチ テキスト形式(rtf)
  • Shockwave Flash(swf)
  • テキスト(ans、txt)。

今後、ファイル形式が追加される可能性があります。最新のリストは、Google のファイル形式に関するよくある質問で確認できます。

この例では、「Google」という単語を含む PDF ドキュメントが返されます。
q=Google+filetype%3Apdf

この例では、「Google」という単語を含む PDF ドキュメントと Word ドキュメントが返されます。
q=Google+filetype%3Apdf+OR+filetype%3Adoc


クエリ語句を含める [+]
説明

包含(+)クエリ用語は、検索結果に含まれるすべてのドキュメントに単語またはフレーズが含まれている必要があることを指定します。包含クエリ用語を使用するには、すべての検索結果に含める必要がある単語またはフレーズの前に「+」(プラス記号)を付けます。

+(プラス記号)の URL エスケープ バージョンは %2B です。

+ は、Google が通常は検索結果の特定前に破棄する一般的な単語の前に使用します。

ユーザー入力: Star Wars Episode +I
クエリ用語: q=Star+Wars+Episode+%2BI

リンクのみの検索、すべての語句 [ allinlinks: ]
説明

allinlinks: クエリ キーワードでは、検索結果のドキュメントに、検索クエリのすべての単語が URL リンクに含まれている必要があります。検索語句は、allinlinks: の後に検索語句の単語を続ける形式で指定する必要があります。

検索クエリに allinlinks: クエリ用語が含まれている場合、Google はドキュメント内の URL リンクのみを検索クエリの単語でチェックし、ドキュメント内の他のテキスト、ドキュメントのタイトル、各ドキュメントの URL は無視します。ドキュメントの URL は、ドキュメントに含まれる URL リンクとは異なります。

allinlinks: の URL エスケープ バージョンは allinlinks%3A です。

ユーザー入力:allinlinks: Google search
クエリ用語:q=allinlinks%3A+Google+search

フレーズ検索
説明

フレーズ検索(")クエリ キーワードを使用すると、フレーズを引用符で囲むか、ハイフンでつなぐことで、完全なフレーズを検索できます。

"(引用符)の URL エスケープ バージョンは %22 です。

フレーズ検索は、有名な引用句や固有名詞を検索する場合に特に便利です。

as_epq リクエスト パラメータを使用して、フレーズ検索を送信することもできます。

ユーザー入力:"Abraham Lincoln"
クエリ用語: q=%22Abraham+Lincoln%22


ウェブ ドキュメント情報 [info:]
説明

info: クエリ語句は、URL が Google の検索インデックスに含まれている限り、その URL に関する一般的な情報を取得します。検索クエリは info:URL の形式で、info: クエリ語句と URL の間にスペースを入れないようにします。

info: の URL エスケープ バージョンは info%3A です。

注: info: を使用する場合は、他のクエリ用語を指定できません。

ユーザー入力: info:www.google.com
クエリ用語: q=info%3Awww.google.com

画像検索のクエリの例

次の例は、さまざまなクエリ パラメータの使用方法を示す 2 つの画像 HTTP リクエストを示しています。さまざまなクエリ パラメータの定義については、このドキュメントの画像クエリ パラメータの定義セクションをご覧ください。

このリクエストは、ファイルタイプが .png のクエリ語句「monkey」(q=monkey)の最初の 5 件の結果(start=0&num=5)をリクエストしています。最後に、クエリは clientoutputcx の各パラメータの値を指定します。これら 3 つのパラメータはすべて必須です。

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

画像検索のクエリ パラメータ

as_filetype
説明

(省略可)指定されたタイプの画像を返します。使用できる値は、bmpgifpngjpgsvg です。

q=google&as_filetype=png

imgsz
説明

(省略可)指定されたサイズの画像を返します。サイズは次のいずれかになります。

  • icon(小)
  • small|medium|large|xlarge(中)
  • xxlarge(大)
  • huge(特大)

q=google&as_filetype=png&imgsz=icon

imgtype
説明

(省略可)次のいずれかのタイプの画像を返します。

  • clipart(クリップアート)
  • face(顔)
  • lineart(線画)
  • news(ニュース)
  • photo(写真)

q=google&as_filetype=png&imgtype=photo

imgc
説明

(省略可)白黒、グレースケール、カラーの画像を返します。

  • mono(白黒)
  • gray(グレースケール)
  • color(色)

q=google&as_filetype=png&imgc=gray

imgcolor
説明

(省略可)特定のドミナント カラーの画像を返します。

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
q=google&as_filetype=png&imgcolor=yellow

as_rights
説明

(省略可)ライセンスに基づくフィルタ。サポートされている値は次のとおりです。

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

q=cats&as_filetype=png&as_rights=cc_attribute

リクエストの上限

次の表に、Google に送信する検索リクエストの制限を示します。

コンポーネント 上限 コメント
検索リクエストの長さ 2,048 バイト  
クエリ語句の数 10 次のパラメータの用語が含まれます: qas_epqas_eqas_lqas_oqas_q
検索結果の表示件数 20 num パラメータを 20 より大きい数値に設定すると、20 件の結果のみが返されます。より多くの結果を取得するには、複数のリクエストを送信し、リクエストごとに start パラメータの値を増やす必要があります。

クエリと結果の表示の国際化

Google WebSearch サービスを使用すると、複数の言語でドキュメントを検索できます。HTTP リクエストの解釈と XML レスポンスのエンコードに使用する文字エンコードを指定できます(ieoe の検索パラメータを使用)。特定の言語で作成されたドキュメントのみが含まれるように結果をフィルタすることもできます。

以降のセクションでは、複数言語での検索に関連する問題について説明します。

文字エンコード

サーバーは、ウェブページなどのデータを、エンコードされたバイトのシーケンスとしてブラウザなどのユーザー エージェントに送信します。ユーザー エージェントは、バイトを文字のシーケンスにデコードします。WebSearch サービスにリクエストを送信するときに、検索クエリと受信する XML レスポンスの両方のエンコード スキームを指定できます。

ie リクエスト パラメータを使用して、HTTP リクエストの文字のエンコード メカニズムを指定できます。また、oe パラメータを使用して、Google が XML レスポンスをエンコードするために使用するエンコード スキームを指定することもできます。ISO-8859-1(または latin1)以外のエンコード スキームを使用している場合は、ie パラメータと oe パラメータに正しい値を指定してください。

注: 複数の言語で検索機能を提供している場合は、ie パラメータと oe パラメータの両方に utf8(UTF-8)エンコード値を使用することをおすすめします。

ie パラメータと oe パラメータに使用できる値の一覧については、付録の文字エンコード方式を参照してください。

文字エンコードに関する一般的な情報については、http://www.w3.org/TR/REC-html40/charset.html をご覧ください。

表示言語

hl リクエスト パラメータを使用すると、グラフィカル インターフェースの言語を指定できます。hl パラメータ値は、XML 検索結果に影響を与える可能性があります。特に、言語制限(lr パラメータを使用)が明示的に指定されていない国際的なクエリでは、その影響が大きくなります。このような場合、hl パラメータは、ユーザーの入力言語と同じ言語の検索結果を優先する可能性があります。

検索結果で hl パラメータを明示的に設定して、各クエリに対して Google が質の高い検索結果を選択できるようにすることをおすすめします。

hl パラメータの有効な値の完全なリストについては、サポートされているインターフェース言語のセクションをご覧ください。

特定の言語で書かれたドキュメントを検索する

lr リクエスト パラメータを使用すると、特定の言語または言語のセットで作成されたドキュメントに検索結果を制限できます。

lr パラメータは、ブール演算子をサポートしています。これにより、検索結果に含める(または除外する)複数の言語を指定できます。

次の例は、ブール演算子を使用してさまざまな言語のドキュメントをリクエストする方法を示しています。

日本語で書かれたドキュメントの場合:

lr=lang_jp

イタリア語またはドイツ語で書かれたドキュメントの場合:

lr=lang_it|lang_de

ハンガリー語またはチェコ語で書かれていないドキュメントの場合:

lr=(-lang_hu).(-lang_cs)

lr パラメータで使用できる値の全一覧については、言語コレクションの値のセクションをご覧ください。また、これらの演算子の使用方法については、ブール演算子のセクションをご覧ください。

簡体字中国語と繁体字中国語は、中国語の 2 つの表記体系です。同じコンセプトでも、それぞれの表記体系で異なる書き方をすることがあります。Google ウェブ検索サービスでは、どちらかの表記体系で入力されたクエリに対して、両方の表記体系のページを含む検索結果を返すことができます。

この機能を使用するには:

  1. c2coff リクエスト パラメータを 0
    に設定します。
  2. 次のいずれかを行います。
    • lr リクエスト パラメータ
      を設定しない場合
    • lr リクエスト パラメータを lr=lang_zh-TW|lang_zh-CN に設定します。

次の例は、簡体字中国語と繁体字中国語の両方で結果をリクエストする場合に含めるクエリ パラメータを示しています(クライアントなどの追加の必須情報は、この例には含まれていません)。

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

結果をフィルタする

Google ウェブ検索では、検索結果をフィルタするさまざまな方法が用意されています。

検索結果の自動フィルタリング

Google では、最適な検索結果を表示するため、次の 2 つの手法を使用して、一般的に望ましくないと見なされる検索結果が自動的にフィルタリングされます。

  • 重複コンテンツ - 複数のドキュメントに同じ情報が含まれている場合、検索結果には、最も関連性の高いドキュメントのみが含まれます。

  • ホストのクラウディング - 同じサイトから多数の検索結果がある場合、Google はそのサイトのすべての結果を表示しないか、通常よりもランキングを下げて表示することがあります。

これらのフィルタは、ほとんどの検索結果の品質を大幅に向上させるため、一般的な検索リクエストではオンにしておくことをおすすめします。ただし、検索リクエストで filter クエリ パラメータを 0 に設定すると、これらの自動フィルタをバイパスできます。

言語と国のフィルタリング

Google WS サービスでは、すべてのウェブ ドキュメントのマスター インデックスから検索結果が返されます。マスター インデックスには、特定の属性(元の言語や国など)でグループ化されたドキュメントのサブコレクションが含まれます。

lr リクエスト パラメータと cr リクエスト パラメータを使用すると、検索結果をそれぞれ特定の言語で書かれたドキュメントのサブコレクション、または特定の国を原産国とするドキュメントのサブコレクションに制限できます。

Google WS はドキュメントの言語を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ドキュメント内の言語メタタグ
  • ドキュメントの本文で使用される主な言語


言語に基づいて結果を制限する方法について詳しくは、lr パラメータの定義、特定の言語で書かれたドキュメントを検索するのセクション、lr パラメータの値として使用できる言語コレクションの値もご覧ください。

Google WS はドキュメントの国を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ウェブサーバーの IP アドレスの地理的位置

原産国で結果を制限する方法について詳しくは、cr パラメータの定義と、cr パラメータの値として使用できる国コレクションの値もご覧ください。

注: 言語の値と国の値を組み合わせて、検索結果をカスタマイズできます。たとえば、フランス語で書かれていて、フランスまたはカナダから提供されたドキュメントをリクエストしたり、オランダから提供された英語以外の言語で書かれたドキュメントをリクエストしたりできます。lr パラメータと cr パラメータはどちらもブール演算子をサポートしています。

セーフサーチによるアダルト コンテンツのフィルタリング

Google のお客様の多くは、成人向けコンテンツを含むサイトの検索結果を表示したくないと考えています。セーフサーチ フィルタを使用すると、アダルト コンテンツを含む検索結果をスクリーニングして除外できます。Google のフィルタは、独自のテクノロジーを使用してキーワード、フレーズ、URL をチェックします。フィルタの精度は 100% ではありませんが、セーフサーチを使用すると、検索結果からほとんどのアダルト コンテンツを除外できます。

Google は、ウェブを継続的にクロールし、ユーザーからの提案による更新を取り入れることで、セーフサーチをできるだけ最新かつ包括的なものにするよう努めています。

セーフサーチは、次の言語でご利用いただけます。

オランダ語
英語
フランス語
ドイツ語
イタリア語
ポルトガル語(ブラジル)
スペイン語
中国語(繁体)

safe クエリ パラメータを使用すると、Google がアダルト コンテンツの検索結果をフィルタリングする度合いを調整できます。次の表に、Google のセーフサーチの設定と、その設定が検索結果に与える影響を示します。

セーフサーチ レベル 説明
セーフサーチのより厳格なバージョンを有効にします。
ポルノやその他の露骨な性的なコンテンツを含むウェブページをブロックします。
オフ アダルト コンテンツを検索結果から除外しません。

* セーフサーチのデフォルト設定は オフです。

セーフサーチを有効にしているにもかかわらず、検索結果に不快なコンテンツを含むサイトが表示される場合は、サイトの URL を safesearch@google.com までメールでお送りください。Google でサイトを調査いたします。

XML の結果

Google XML 結果 DTD

Google は、同じ DTD を使用して、すべてのタイプの検索結果の XML 形式を記述します。タグと属性の多くは、すべての検索タイプに適用できます。ただし、一部のタグは特定の検索タイプにのみ適用されます。したがって、DTD の定義は、このドキュメントで説明する定義よりも制限が緩い場合があります。

このドキュメントでは、ウェブ検索に関連する DTD の側面について説明します。ウェブ検索に取り組んでいる場合は、DTD を確認する際に、ここに記載されていないタグや属性は無視しても問題ありません。DTD とドキュメントで定義が異なる場合は、このドキュメントに記載されています。

Google は、最新の DTD への参照の有無にかかわらず、XML 結果を返すことができます。DTD は、検索管理者と XML パーサーが Google の XML 結果を理解するのに役立つガイドです。Google の XML 文法は随時変更される可能性があるため、DTD を使用して各 XML 結果を検証するようにパーサーを設定しないでください。

また、検索リクエストを送信するたびに DTD を取得するように XML パーサーを設定しないでください。Google は DTD を頻繁に更新しません。このようなリクエストは、不要な遅延と帯域幅の要件を生み出します。

XML の結果を取得するには、xml_no_dtd 出力形式を使用することをおすすめします。検索リクエストで xml 出力形式を指定した場合、XML 結果に次の行が含まれる点のみが異なります。

<!DOCTYPE GSP SYSTEM "google.dtd">

最新の DTD には、http://www.google.com/google.dtd からアクセスできます。

DTD のすべての機能が現在利用可能またはサポートされているわけではありません。

XML レスポンスについて

  • XML タグの定義で特に断りのない限り、すべての要素の値は表示に適した有効な HTML です。
  • 要素の値の一部は、表示する前に HTML エンコードする必要がある URL です。
  • XML パーサーは、ドキュメント化されていない属性とタグを無視する必要があります。これにより、Google が XML 出力に機能を追加した場合でも、アプリケーションを変更せずに動作を継続できます。
  • XML タグの値として含める場合は、特定の文字をエスケープする必要があります。XML プロセッサは、これらのエンティティを適切な文字に変換する必要があります。エンティティを適切に変換しないと、ブラウザで & 文字が &amp; としてレンダリングされることがあります。これらの文字は XML 標準で規定されています。これらの文字を以下の表に示します。

    キャラクター エスケープされたフォーム エンティティ 文字コード
    アンパサンド & &amp; &#38;
    一重引用符 ' &apos; &#39;
    二重引用符 " &quot; &#34;
    不等記号(より大) > &gt; &#62;
    不等記号(より小) < &lt; &#60;

通常の検索クエリと高度な検索クエリの XML 結果

通常検索/詳細検索: サンプルクエリと XML 結果

この WebSearch リクエストの例では、「socer」という検索語句(q=socer)に関する 10 件の結果(num=10)をリクエストしています(「socer」は、この例のために「soccer」のスペルを意図的に間違えたものです)。

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

このリクエストは、次の XML 結果を返します。XML 結果には、結果に含まれていない特定のタグが表示される場所を示すコメントがいくつか含まれています。

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/

<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/

<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/

</RES>
</GSP>

通常検索/詳細検索: XML タグ

通常の検索リクエストと高度な検索リクエストの両方の XML レスポンスで、同じ XML タグのセットが使用されます。これらの XML タグは、上記の XML の例に示されており、以下の表で説明されています。

以下の XML タグはタグ名でアルファベット順に並べられています。各タグの定義には、タグの説明、XML 結果でのタグの表示例、タグのコンテンツの形式が含まれています。タグが別の XML タグのサブタグである場合、またはタグ自体にサブタグや属性がある場合、その情報もタグの定義テーブルに記載されます。

以下の定義では、一部のサブタグの横に特定の記号が表示されることがあります。表示される記号とその意味は次のとおりです。

? = 省略可能なサブタグ
* = サブタグの 0 個以上のインスタンス
+ = サブタグの 1 個以上のインスタンス
A B C D F G H I L M N P Q R S T U X

anchor_text
定義

<anchor_text> タグは、検索結果セットに関連付けられた絞り込みラベルを識別するためにユーザーに表示するテキストを指定します。絞り込みラベルでは英数字以外の文字がアンダースコアに置き換えられるため、ユーザー インターフェースに <label> タグの値を表示しないでください。代わりに、<anchor_text> タグの値を表示する必要があります。

<anchor_text>ゴルフコース</anchor_text>
親タグ FacetItem
コンテンツの形式 テキスト

ブロック
定義

このタグは、プロモーション結果の本文行のブロックの内容をカプセル化します。各ブロックには、TUL のサブタグがあります。空でない T タグは、ブロックにテキストが含まれていることを示します。空でない U タグと L タグは、ブロックにリンクが含まれていることを示します(URL は U サブタグで指定され、アンカー テキストは L サブタグで指定されます)。

サブタグ TUL
親タグ BODY_LINE
コンテンツの形式 空白

BODY_LINE
定義

このタグは、プロモーション結果の本文の行の内容をカプセル化します。各本文行は複数の BLOCK タグで構成され、テキストまたは URL とアンカー テキストを含むリンクのいずれかが含まれます。

サブタグ BLOCK*
親タグ SL_MAIN
コンテンツの形式 空白

C
定義

<C> タグは、WebSearch サービスがこの検索結果 URL のキャッシュ バージョンを取得できることを示します。XML API を使用してキャッシュに保存されたページを取得することはできませんが、このコンテンツについてはユーザーを www.google.com にリダイレクトできます。

属性
名前 形式 説明
SZ テキスト(整数 + "k") 検索結果のキャッシュ バージョンのサイズをキロバイト(「k」)単位で返します。
お客様 ID テキスト Google のキャッシュ内のドキュメントを識別します。キャッシュからドキュメントを取得するには、次のように作成された検索語句を送信します。
cache:CIDtext:escapedURL

エスケープされた URL は UE タグで確認できます。

<C SZ="6k" CID="kvOXK_cYSSgJ" />
親タグ HAS
コンテンツの形式 空白

C2C
定義 <C2C> タグは、結果が中国語(繁体字)のページを参照していることを示します。このタグは、[Simplified and Traditional Chinese Search] が有効になっている場合にのみ表示されます。この機能の有効化と無効化について詳しくは、c2coff クエリ パラメータの定義をご覧ください。
コンテンツの形式 テキスト

コンテキスト
定義

<Context> タグは、一連の検索結果に関連付けられた絞り込みラベルのリストをカプセル化します。

<Context>
サブタグ title, Facet+
コンテンツの形式 コンテナ

CRAWLDATE
定義

<CRAWLDATE> タグは、ページが最後にクロールされた日付を示します。CRAWLDATE はすべての検索結果ページで返されるわけではありません。

<CRAWLDATE>2005 年 5 月 21 日</CRAWLDATE>
親タグ R
コンテンツの形式 テキスト

DI
定義

<DI> タグは、単一の検索結果の Open Directory Project(ODP)カテゴリ情報をカプセル化します。

<DI>
サブタグ DT?, DS?
親タグ HAS
コンテンツの形式 空白

DS
定義

<DS> タグは、ODP ディレクトリの単一のカテゴリにリストされている概要を提供します。

<DS>インターネットに直接&lt;b&gt;サッカー&lt;/b&gt;の履歴書を投稿します。</DS>
親タグ DI
コンテンツの形式 テキスト(HTML を含む場合あり)

DT
定義

<DT> タグは、ODP ディレクトリに掲載されている単一のカテゴリのタイトルを提供します。

<DT>SoccerConnection.net</DT>
親タグ DI
コンテンツの形式 テキスト(HTML を含む場合あり)

ファセット
定義

<Facet> タグには、<FacetItem> タグの論理グループが含まれます。これらのグループは、プログラム可能検索エンジンの XML 仕様形式を使用して作成できます。これらのグループを作成しない場合、results_xml_tag_Context><Context> タグには最大 4 つの <Facet> タグが含まれます。各 <Facet> タグ内の項目は表示目的でグループ化されますが、論理的な関係がない場合があります。

<Facet>
サブタグ FacetItem+、title+
親タグ 文脈
コンテンツの形式 コンテナ

FacetItem
定義

<FacetItem> タグは、一連の検索結果に関連付けられた絞り込みラベルに関する情報をカプセル化します。

<FacetItem>
サブタグ label, anchor_text+
親タグ Facet
コンテンツの形式 FacetItem

FI
定義 <FI> タグは、検索でドキュメントのフィルタリングが実行されたかどうかを示すフラグとして機能します。Google の検索結果フィルタについて詳しくは、このドキュメントの自動フィルタリングのセクションをご覧ください。
<FI />
親タグ RES
コンテンツの形式 空白

GSP
定義

<GSP> タグは、Google XML 検索結果で返されるすべてのデータをカプセル化します。「GSP」は「Google Search Protocol」の略語です。

属性
名前 形式 説明
VER テキスト(整数) VER 属性は、検索結果の出力のバージョンを指定します。現在の出力バージョンは「3.2」です。
<GSP VER="3.2">
サブタグ PARAM+, Q, RES?, TM
コンテンツの形式 空白

HAS
定義 <HAS> タグは、特定の URL でサポートされている特別な検索リクエスト パラメータに関する情報をカプセル化します。

注: WebSearch の <HAS> の定義は、DTD の定義よりも厳格です。

サブタグ DI?L?C?RT
親タグ R

ISURL
定義 関連付けられた検索クエリが URL の場合、Google は <ISURL> タグを返します。
親タグ GSP
コンテンツの形式 空白

L
定義 <L> タグが存在する場合、WebSearch サービスはこの検索結果 URL にリンクしている他のサイトを見つけることができます。そのようなサイトを見つけるには、link: という特別なクエリ語句を使用します。
親タグ HAS
コンテンツの形式 空白

label
定義

<label> タグは、受け取る検索結果をフィルタするために使用できる絞り込みラベルを指定します。絞り込みラベルを使用するには、次の例に示すように、Google への HTTP リクエストの q パラメータの値に文字列 more:[[ラベルタグの値]] を追加します。この値は、Google にクエリを送信する前に URL エスケープする必要があります。

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

注: <label> タグは、検索結果内の特定の URL に関連付けられた絞り込みラベルを識別する <Label> タグとは異なります。

<label>golf_courses</label>
親タグ FacetItem
コンテンツの形式 テキスト

LANG
定義

<LANG> タグには、検索結果の言語に関する Google の最良の推測が含まれています。

<LANG>en</LANG>
親タグ R
コンテンツの形式 テキスト

M
定義

<M> タグは、検索結果の推定合計数を識別します。

注: この見積もりは正確でない場合があります。

<M>16200000</M>
親タグ RES
コンテンツの形式 テキスト

新生児
定義

<NB> タグは、結果セットのナビゲーション情報(検索結果の次のページまたは前のページへのリンク)をカプセル化します。

注: このタグは、さらに結果がある場合にのみ存在します。

<NB>
サブタグ NU?, PU?
親タグ RES
コンテンツの形式 空白

NU
定義

<NU> タグには、検索結果の次のページへの相対リンクが含まれます。

<NU>/search?q=flowers&num=10&hl=en&ie=UTF-8
    &output=xml&client=test&start=10</NU>
親タグ NB
コンテンツの形式 テキスト(相対 URL)

PARAM
定義

<PARAM> タグは、XML 結果に関連付けられた HTTP リクエストで送信された入力パラメータを識別します。パラメータに関する情報は、タグ属性(name、value、original_value)に含まれています。HTTP リクエストで送信されたパラメータごとに 1 つの PARAM タグがあります。

属性
名前 形式 説明
name テキスト 入力パラメータ名。
value HTML 入力パラメータ値の HTML 形式のバージョン。
original_value テキスト 入力パラメータ値の元の URL エスケープ バージョン。
<PARAM name="cr" value="countryNZ" original_value="countryNZ" />
親タグ GSP
コンテンツの形式 複雑

PU
定義

<PU> タグは、検索結果の前のページへの相対リンクを提供します。

<PU>/search?q=flowers&num=10&hl=en&output=xml
    &client=test&start=10</PU>
親タグ NB
コンテンツの形式 テキスト(相対 URL)

Q
定義

<Q> タグは、XML 結果に関連付けられた HTTP リクエストで送信された検索クエリを識別します。

<Q>pizza</Q>

親タグ GSP
コンテンツの形式 テキスト

R
定義

<R> タグは、個々の検索結果の詳細をカプセル化します。

注: WebSearch の <R> タグの定義は、DTD よりも制限が厳しくなっています。

属性
名前 形式 説明
N テキスト(整数) この検索結果のインデックス(1 から始まる)を示します。
MIME テキスト 検索結果の MIME タイプを示します。
サブタグ UUET?、CRAWLDATES?、LANG?、HAS
親タグ RES

RES
定義

<RES> タグは、個々の検索結果とそれらの結果に関する詳細情報のセットをカプセル化します。

属性
名前 形式 説明
SN テキスト(整数) この結果セットで返される最初の検索結果のインデックス(1 ベース)を示します。
EN テキスト(整数) この結果セットで返された最後の検索結果のインデックス(1 ベース)を示します。
<RES SN="1" EN="10">
サブタグ MFI?、XT?、NB?、R*
親タグ GSP
コンテンツの形式 空白

S
定義

<S> タグには、検索結果の抜粋が含まれています。クエリ語句は太字でハイライト表示されます。テキストの折り返しが適切に行われるように、抜粋には改行が含まれています。

<S>ワシントン(CNN) - ブッシュ大統領の司法官指名に関する上院の対立を解消する試みにより、5 人の候補者が最終投票に進むことが可能になるが、&lt;b&gt;...&lt;b&gt;...&lt;/b&gt;<S>
親タグ R
コンテンツの形式 テキスト(HTML)

SL_MAIN
定義

このタグは、プロモーション結果の内容をカプセル化します。プロモーションの解析に使用します。タイトルリンクのアンカー テキストと URL は、それぞれ T サブタグと U サブタグに含まれます。本文の行とリンクは、BODY_LINE サブタグに含まれます。

サブタグ BODY_LINE*, T, U
親タグ SL_RESULTS
コンテンツの形式 空白

SL_RESULTS
定義

プロモーション結果のコンテナタグ。検索結果にプロモーションが表示されるたびに、このタグのいずれかが表示されます。SL_MAIN サブタグには、メインの結果データが含まれます。

サブタグ SL_MAIN*
親タグ R
コンテンツの形式 空白

スペル
定義

<Spelling> タグは、送信されたクエリの代替スペル候補をカプセル化します。このタグは、検索結果の 1 ページ目にのみ表示されます。スペル候補は、英語、中国語、日本語、韓国語でご利用いただけます。

注: Google は、gl パラメータ値が小文字のクエリに対してのみスペル候補を返します。

<Spelling>
サブタグ 候補
親タグ GSP
コンテンツの形式 空白

提案
定義 <Suggestion> タグには、送信されたクエリの代替スペル候補が含まれます。このタグのコンテンツを使用して、検索ユーザーに代替スペルを提案できます。q 属性の値は、クエリ語句として使用できる URL エスケープされたスペル候補です。
属性
名前 形式 説明
q テキスト q 属性は、スペル候補の URL エスケープ バージョンを指定します。
<Suggestion q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Suggestion>
親タグ スペル
コンテンツの形式 テキスト(HTML)

T
定義 <T> タグには、結果のタイトルが含まれます。
<T>Amici's East Coast Pizzeria</T>
親タグ R
コンテンツの形式 テキスト(HTML)

title
定義

<Context> の子として、<title> タグにはプログラム可能検索エンジンの名前が含まれます。

<Facet> の子として、<title> タグはファセットのセットのタイトルを提供します。

<Context> の子として: <title>My Search Engine</title>

<Facet> の子として: <title>ファセットのタイトル</title>

親タグ ContextFacet
コンテンツの形式 テキスト

TM
定義

<TM> タグは、検索結果を返すために必要なサーバーの合計時間を秒単位で示します。

<TM>0.100445</TM>
親タグ GSP
コンテンツの形式 テキスト(浮動小数点数)

TT
定義 <TT> タグは検索のヒントを提供します。
<TT>&lt;i&gt;ヒント: ほとんどのブラウザでは、Return キーを押すと、検索ボタンをクリックした場合と同じ結果が得られます。&lt;/i&gt;</TT>
親タグ GSP

U
定義 <U> タグは、検索結果の URL を提供します。
<U>http://www.dominos.com/</U>
親タグ R
コンテンツの形式 テキスト(絶対 URL)

UD
定義

<UD> タグは、検索結果の IDN エンコード(国際化ドメイン名)URL を提供します。この値により、ドメインをローカル言語で表示できます。たとえば、IDN エンコードされた URL http://www.%E8%8A%B1%E4%BA%95.com は、デコードされて http://www.花井鮨.com として表示される可能性があります。この <UD> タグは、ud パラメータを含むリクエストの検索結果にのみ含まれます。

注: これはベータ版の機能です。

<UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
親タグ R
コンテンツの形式 テキスト(IDN エンコードされた URL)

UE
定義 <UE> タグは、検索結果の URL を提供します。値は URL エスケープされているため、URL のクエリ パラメータとして渡すのに適しています。
<UE>http://www.dominos.com/</UE>
親タグ R
コンテンツの形式 テキスト(URL エスケープされた URL)

XT
定義 <XT> タグは、M タグで指定された推定結果総数が、実際の結果総数を正確に表していることを示します。詳しくは、このドキュメントの自動フィルタリングのセクションをご覧ください。
<XT />
親タグ RES
コンテンツの形式 空白


画像検索クエリの XML 結果

このサンプル画像リクエストは、「monkey」という検索語句(q=monkey)について 5 件の結果(num=5)をリクエストしています。

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

このリクエストは、次の XML 結果を返します。

<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

画像検索: XML タグ

次の表は、画像検索クエリの XML レスポンスで使用される追加の XML タグを示しています。

以下の定義では、一部のサブタグの横に特定の記号が表示されることがあります。表示される記号とその意味は次のとおりです。

? = 省略可能なサブタグ
* = サブタグの 0 個以上のインスタンス
+ = サブタグの 1 個以上のインスタンス

RG
定義

<RG> タグは、個々の画像検索の結果の詳細を囲みます。

属性
名前 形式 説明
N テキスト(整数) この検索結果のインデックス(1 から始まる)を示します。
MIME テキスト 検索結果の MIME タイプを示します。
親タグ RES
RU
定義

<RU タグ> タグは、各画像検索の結果の詳細を囲みます。

親タグ R