このページは Cloud Translation API によって翻訳されました。

Overview

はじめに

注: このドキュメントは現在開発中です。今後の改善を予定しています。

Google セーフブラウジング v5 は、Google セーフブラウジング v4 を進化させたものです。v5 での主な変更点は、データの更新速度と IP プライバシーの 2 つです。さらに、柔軟性と効率を高め、肥大化を軽減するために API サーフェスが改善されました。さらに、Google セーフブラウジング v5 は、v4 からの移行を容易にするように設計されています。

現在、Google は v4 と v5 の両方を提供しており、どちらも本番環境に対応しています。v4 または v5 のいずれかを使用できます。v4 を廃止する日付についてはまだ発表していませんが、廃止する場合は、少なくとも 1 年前に通知いたします。このページでは、v5 について説明し、v4 から v5 への移行ガイドを示します。v4 の完全なドキュメントは、現在も公開されています。

データの更新頻度

Google セーフブラウジング v5 が v4（具体的には v4 Update API）から大きく改善された点の 1 つは、データの更新頻度と対象範囲です。保護がクライアントが管理するローカル・データベースに大きく依存するため、ローカル・データベースの更新の遅延とサイズが、保護されない主な原因となっています。v4 の場合、最新版の脅威リストを取得するのに通常 20 ～ 50 分かかります。残念なことに、フィッシング攻撃は急速に広がります。2021 年現在、攻撃を行うサイトの 60% が 10 分以内に応答しています。Google の分析によると、フィッシング対策が機能しない約 25 ～ 30% は、このようなデータの未更新が原因です。さらに、一部のデバイスは Google セーフブラウジングの脅威リスト全体を管理できておらず、時間の経過とともに拡大し続けています。

v5 では、リアルタイム保護と呼ばれる運用モードが導入されています。これにより、前述のデータ未更新の問題を回避できます。v4 では、クライアントはローカルデータベースをダウンロードして維持し、ローカルにダウンロードした脅威リストと照合し、プレフィックスの部分一致の場合はリクエストを実行して、ハッシュ全体をダウンロードすることが想定されています。v5 では、クライアントは脅威リストのローカルデータベースを引き続きダウンロードして維持する必要がありますが、クライアントは、無害である可能性が高いサイトのリスト（グローバルキャッシュと呼ばれる）をダウンロードし、このグローバルキャッシュのローカルチェックとローカルの脅威リストチェックの両方を実行し、最後に、脅威リストの接頭辞が部分一致の場合、またはグローバルキャッシュに一致しない場合に、完全なハッシュのダウンロードをリクエストします。（クライアントが必要とするローカル処理の詳細については、以下の手順を参照してください）。これは、「デフォルトで許可」から「デフォルトで確認」に移行することを意味しており、ウェブ上での脅威の拡散が加速されることを踏まえて保護を強化できます。言い換えれば、このプロトコルはほぼリアルタイムで保護するように設計されたもので、クライアントがより新しい Google セーフブラウジングデータを活用することを目指しています。

IP プライバシー

Google セーフブラウジング（v4 または v5）では、リクエストの処理中にユーザー ID に関連する処理は一切行われません。Cookie が送信されても無視されます。リクエストの送信元の IP アドレスは Google に認識されますが、この IP アドレスは重要なネットワーキングニーズ（レスポンスの送信など）と DoS 対策の目的でのみ使用されます。

v5 と並行して、Safe Browsing Oblivious HTTP Gateway API というコンパニオン API を導入します。Oblivious HTTP を使用して、エンドユーザーの IP アドレスを Google から非表示にします。コラボレーションしない第三者で暗号化されたユーザーリクエストを処理し、それを Google に転送するという仕組みです。つまり、サードパーティは IP アドレスにのみアクセスでき、Google はリクエストのコンテンツにのみアクセスできます。サードパーティは Oblivious HTTP Relay（Fastly が提供するサービスなど）を運用し、Google は Oblivious HTTP ゲートウェイを運用しています。これはオプションのコンパニオン API です。Google セーフブラウジングと併用すると、エンドユーザーの IP アドレスが Google に送信されなくなります。

適切な使用方法

使用上の許可

Safe Browsing API は非営利目的での使用のみを目的としています（「販売や収益創出を目的としない」）。商用目的のソリューションが必要な場合は、Web Risk をご覧ください。

料金

Google Safe Browsing API はすべて無料でご利用いただけます。

割り当て

デベロッパーには、Safe Browsing API を有効にすると、デフォルトの使用量割り当てが割り当てられます。現在の割り当てと使用量は、Google Developer Console で確認できます。現在割り当てられている割り当てを超えることが予想される場合は、Play Console の割り当てインターフェースから追加の割り当てをリクエストできます。Google はこれらのリクエストを審査し、サービスの可用性がすべてのユーザーのニーズを満たしていることを確認するために、割り当ての増加を申請する際に連絡をお願いしています。

適切な URL

Google セーフブラウジングは、ブラウザのアドレスバーに表示される URL に作用するように設計されています。サブリソース（HTML ファイルによって参照される JavaScript や画像、JavaScript によって開始された WebSocket URL など）のチェックに使用するようには設計されていません。このようなサブリソース URL は、Google セーフブラウジングと照合しないでください。

URL にアクセスしてリダイレクト（HTTP 301 など）する場合は、リダイレクト URL を Google セーフブラウジングに照らしてチェックすることをおすすめします。クライアントサイドで History.pushState などの URL 操作が行われても、新しい URL が Google セーフブラウジングでチェックされることはありません。

ユーザーへの警告

Google セーフブラウジングを使用して特定のウェブページのリスクについてユーザーに警告する場合は、次のガイドラインが適用されます。

このガイドラインは、ページが安全でないウェブリソースであると 100% 確実にはわからないページであること、および警告が潜在的なリスクを特定するだけであることを明確にすることで、ニュースメディアと Google の両方を誤解から守ることを目的としています。

ユーザーに表示される警告で、問題のページが安全でないウェブリソースであるという確信を持たせることはできません。特定されているページ、またはそのページがユーザーにもたらす潜在的なリスクに言及する場合は、「疑わしい」、「潜在的」、「可能性あり」、「可能性あり」などの用語を使用して警告を確認する必要があります。
警告は、ユーザーが Google によるさまざまな脅威の定義を確認することで詳細を把握できるようにする必要があります。次のリンクをおすすめします。
- ソーシャルエンジニアリング: https://developers.google.com/search/docs/monitor-debug/security/social-engineering
- マルウェアと望ましくないソフトウェア: https://developers.google.com/search/docs/monitor-debug/security/malware
- 有害な可能性があるアプリ（Android のみ）: https://developers.google.com/android/play-protect/potentially-harmful-applications
セーフブラウジングサービスで危険と判断されたページについて警告を表示する場合は、「Google 提供のアドバイザリ」という行とセーフブラウジングアドバイザリへのリンクを記載して、Google に帰属を表示する必要があります。商品に他のソースに基づく警告も表示される場合、Google 以外のデータから得られる警告に Google アトリビューションを含めることはできません。
サービスのドキュメントでは、Google セーフブラウジングによる保護は完全ではないことをユーザーに知らせる通知を行う必要があります。偽陽性（リスクがあると報告された安全なサイト）と偽陰性（リスクのフラグが付けられていないサイト）の両方の可能性があることを、保護者に知らせる必要があります。次の表現を使用することをおすすめします。

Google は、安全でないウェブリソースについて、正確で最新の情報を提供するために尽力しています。ただし、Google では、サイトの情報が包括的でエラーがないことを保証するものではありません。危険なサイトが検出されない場合や、安全なサイトが誤って特定される場合もあります。

運用モード

Google セーフブラウジング v5 では、クライアントは 3 つの動作モードから選択できます。

リアルタイムモード

クライアントがリアルタイムモードで Google セーフブラウジング v5 を使用する場合、クライアントはローカルデータベースに次のものを保持します。（i）正当なサイトのグローバルキャッシュ（ホストサフィックス/パスプレフィックスの URL 式の SHA256 ハッシュ形式）、（ii）一連の脅威リスト（ホストサフィックス/パスプレフィックス URL 式の SHA256 ハッシュプレフィックス形式）大まかに言えば、クライアントが特定の URL をチェックするたびに、Global Cache を使用してローカルチェックが実行されます。チェックに合格すると、ローカル脅威リストのチェックが実行されます。それ以外の場合、クライアントは以下で説明するようにリアルタイムハッシュチェックを続行します。

ローカルデータベースに加えて、クライアントはローカルキャッシュを保持します。このようなローカルキャッシュは、永続ストレージに存在する必要はなく、メモリが圧迫された場合に消去される場合があります。

手順の詳細については、下記をご覧ください。

ローカルリストモード

このモードで Google セーフブラウジング v5 を選択した場合、クライアントの動作は v5 の改善された API サーフェスを使用している点を除き、v4 Update API と同様です。クライアントはローカル・データベースに、ホスト・サフィックス/パス・プレフィックスの URL 式の SHA256 ハッシュ・プレフィックスとしてフォーマットされた一連の脅威リストを保持します。クライアントが特定の URL をチェックするたびに、ローカルの脅威リストを使用してチェックが実行されます。一致する場合にのみ、クライアントはサーバーに接続してチェックを続行します。

上記と同様に、クライアントは永続ストレージに必要のないローカルキャッシュも保持します。

ストレージ不要のリアルタイムモード

クライアントが Google セーフブラウジング v5 をストレージ不要のリアルタイムモードで使用することを選択した場合、クライアントはローカルデータベースを維持する必要がありません。クライアントが特定の URL をチェックすると、常にサーバーに接続してチェックが実行されます。このモードは、v4 Lookup API のクライアントが実装できるモードに似ています。

URL の確認

このセクションでは、クライアントによる URL の確認方法について詳しく説明します。

URL の正規化

URL を確認する前に、クライアントはその URL を正規化する必要があります。

まず、クライアントが URL を解析し、RFC 2396 に従って有効であると仮定します。URL が国際化ドメイン名（IDN）を使用している場合、クライアントは URL を ASCII Punycode 表現に変換する必要があります。URL にはパスコンポーネントを含める必要があります。つまり、ドメインの後にスラッシュを 1 つ以上含める必要があります（http://google.com ではなく http://google.com/）。

まず、URL からタブ（0x09）、CR（0x0d）、および LF（0x0a）文字を削除します。これらの文字のエスケープシーケンス（%0a など）は削除しないでください。

次に、URL がフラグメントで終わる場合は、そのフラグメントを削除します。たとえば、http://google.com/#frag を http://google.com/ に短縮します。

次に、パーセントエスケープがなくなるまで、URL に対してパーセントエスケープを繰り返します。（これにより、URL が無効になることがあります）。

ホスト名を正規化するには:

URL からホスト名を抽出し、次の操作を行います。

先頭と末尾のドットをすべて削除する。
連続するドットを 1 つのドットに置き換える。
ホスト名を IPv4 アドレスとして解析できる場合は、4 つのドット区切りの 10 進数に正規化します。クライアントは、8 進数、16 進数、4 個未満のコンポーネントを含む、有効な IP アドレスエンコードを処理する必要があります。
ホスト名を角かっこ付き IPv6 アドレスとして解析できる場合は、コンポーネント内の不要な先行ゼロを削除し、ダブルコロン構文を使用してゼロコンポーネントを折りたたんで、ホスト名を正規化します。たとえば、[2001:0db8:0000::1] は [2001:db8::1] に変換する必要があります。ホスト名が次の 2 つの特殊な IPv6 アドレスタイプのいずれかである場合は、IPv4 に変換します。
- IPv4 にマッピングされた IPv6 アドレス（[::ffff:1.2.3.4] など）。1.2.3.4 に変換する必要があります。
- 既知のプレフィックス 64:ff9b::/96 を使用した NAT64 アドレス（[64:ff9b::1.2.3.4] など）。1.2.3.4 に変換する必要があります。
文字列全体を小文字にする。

パスを正規化するには:

パス内のシーケンス /../ と /./ を解決するには、/./ を / に置き換え、/../ を先行するパスコンポーネントとともに削除します。
連続するスラッシュの実行は単一のスラッシュ文字に置き換えます。

これらのパスの正規化をクエリパラメータに適用しないでください。

URL 内で、ASCII 32 以上、127 以上、#、% の文字をすべてパーセントエスケープします。エスケープには大文字の 16 進数を使用する必要があります。

ホスト / サフィックス / パス / プレフィックス式

URL を正規化したら、次のステップはサフィックス/プレフィックスの式を作成することです。各サフィックス/プレフィックス式は、ホストサフィックス（またはフルホスト）とパスプレフィックス（またはフルパス）で構成されます。

クライアントは、最大 30 の異なるホストサフィックスとパスプレフィックスの組み合わせを形成します。これらの組み合わせでは、URL のホストとパスのコンポーネントのみを使用します。スキーム、ユーザー名、パスワード、ポートは破棄されます。URL にクエリパラメータが含まれている場合は、少なくとも 1 つの組み合わせにフルパスとクエリパラメータが含まれます。

ホストの場合、クライアントは最大で 5 つの異なる文字列を試行します。できます。

ホスト名が IPv4 または IPv6 のリテラルでない場合、eTLD+1 ドメインで始まり、先頭に続くコンポーネントを追加することで形成される最大 4 つのホスト名。eTLD+1 の判断は、公開サフィックスリストに基づいて行う必要があります。たとえば、a.b.example.com は、eTLD+1 ドメイン example.com と、ホストコンポーネントが 1 つ追加 b.example.com になります。
URL の正確なホスト名。前の例では、a.b.example.com がチェックされます。

パスの場合、クライアントは最大で 6 つの異なる文字列を試行します。次のとおりです。

クエリパラメータを含む URL の正確なパス。
クエリパラメータなしの URL の正確なパス。
ルート（/）から始まり、末尾のスラッシュを含むパスコンポーネントを連続して追加することによって形成される 4 つのパス。

次の例では、チェックの動作を示します。

URL http://a.b.com/1/2.html?param=1 の場合、クライアントは次の文字列の候補を試行します。

a.b.com/1/2.html?param=1
a.b.com/1/2.html
a.b.com/
a.b.com/1/
b.com/1/2.html?param=1
b.com/1/2.html
b.com/
b.com/1/

URL http://a.b.c.d.e.f.com/1.html の場合、クライアントは次の文字列の候補を試行します。

a.b.c.d.e.f.com/1.html
a.b.c.d.e.f.com/
c.d.e.f.com/1.html
c.d.e.f.com/
d.e.f.com/1.html
d.e.f.com/
e.f.com/1.html
e.f.com/
f.com/1.html
f.com/

（注: 最後の 5 つのホスト名コンポーネントと完全なホスト名のみを取得するため、b.c.d.e.f.com はスキップします）。

URL http://1.2.3.4/1/ の場合、クライアントは次の文字列の候補を試行します。

1.2.3.4/1/
1.2.3.4/

URL http://example.co.uk/1 の場合、クライアントは次の文字列の候補を試行します。

example.co.uk/1
example.co.uk/

ハッシュ化

Google セーフブラウジングでは、ハッシュ関数として SHA256 のみが使用されます。このハッシュ関数は、上記の式に適用する必要があります。

完全な 32 バイトのハッシュは、状況に応じて、4 バイト、8 バイト、または 16 バイトに切り捨てられます。

現在、hashes.search メソッドを使用する場合、リクエストのハッシュは 4 バイトに切り捨てられます。このリクエストで追加のバイト数を送信すると、ユーザーのプライバシーが侵害されます。
hashList.get メソッドまたは hashLists.batchGet メソッドを使用してローカルデータベースのリストをダウンロードする場合、サーバーによって送信されるハッシュの長さは、リストの性質と、desired_hash_length パラメータで伝達されるクライアントの設定（ハッシュ長）の両方に影響されます。

リアルタイムの URL チェック手順

この手順は、クライアントがリアルタイムオペレーションモードを選択した場合に使用されます。

この手順は、単一の URL u を受け取り、SAFE、UNSAFE、または UNSURE を返します。SAFE が返された場合、その URL は Google セーフブラウジングによって安全であるとみなされます。UNSAFE が返された場合、その URL は Google セーフブラウジングによって安全でない可能性があると判断されたため、エンドユーザーに警告を表示する、受信したメールを迷惑メールフォルダに移動する、続行する前にユーザーによる追加の確認を求めるなどの適切な措置を講じる必要があります。UNSURE が返された場合は、後で次のローカルチェック手順を使用します。

expressions を、URL u によって生成された接尾辞または接頭辞の式のリストとします。
expressionHashes をリストにすると、要素は expressions 内の各式の SHA256 ハッシュです。
expressionHashes の hash ごとに次の操作を行います。
1. グローバルキャッシュで hash が見つかった場合は、UNSURE を返します。
expressionHashPrefixes をリストにします。このリストでは、要素は expressionHashes の各ハッシュの最初の 4 バイトです。
expressionHashPrefixes の expressionHashPrefix ごとに次の操作を行います。
1. ローカルキャッシュで expressionHashPrefix を検索します。
2. キャッシュに保存されたエントリが見つかった場合:
  1. 現在の時刻が有効期限より後かどうかを判断します。
  2. 大きい場合:
    1. 検出されたキャッシュエントリをローカルキャッシュから削除します。
    2. ループを続行します。
  3. その値より大きい場合:
    1. この特定の expressionHashPrefix を expressionHashPrefixes から削除します。
    2. expressionHashes 内の対応する完全なハッシュが、キャッシュエントリにあるかどうかを確認します。
    3. 見つかった場合は、UNSAFE を返します。
    4. 見つからなかった場合は、ループを続けます。
3. キャッシュエントリが見つからない場合は、ループを続けます。
RPC SearchHashes または REST メソッド hashes.search を使用して、expressionHashPrefixes を Google セーフブラウジング v5 サーバーに送信します。エラー（ネットワークエラー、HTTP エラーなど）が発生した場合は、UNSURE を返します。それ以外の場合、レスポンスは SB サーバーから受信した response とします。これは、脅威の性質（ソーシャルエンジニアリング、マルウェアなど）を特定する補助情報とともに完全なハッシュのリストと、キャッシュの有効期限 expiration です。
response の fullHash ごとに次の操作を行います。
1. fullHash を expiration とともにローカルキャッシュに挿入します。
response の fullHash ごとに次の操作を行います。
1. expressionHashes で fullHash が見つかった結果を isFound とします。
2. isFound が False の場合は、ループを続行します。
3. isFound が True の場合、UNSAFE を返します。
SAFE を返します。

LocalThreat List の URL チェック手順

このプロシージャは、クライアントがローカルリストモードを選択した場合に使用されます。また、上記の RealTimeCheck プロシージャが UNSURE の値を返すときにも使用されます。

この手順は、単一の URL u を受け取り、SAFE または UNSAFE を返します。

expressions を、URL u によって生成された接尾辞または接頭辞の式のリストとします。
expressionHashes をリストにすると、要素は expressions 内の各式の SHA256 ハッシュです。
expressionHashPrefixes をリストにします。このリストでは、要素は expressionHashes の各ハッシュの最初の 4 バイトです。
expressionHashPrefixes の expressionHashPrefix ごとに次の操作を行います。
1. ローカルキャッシュで expressionHashPrefix を検索します。
2. キャッシュに保存されたエントリが見つかった場合:
  1. 現在の時刻が有効期限より後かどうかを判断します。
  2. 大きい場合:
    1. 検出されたキャッシュエントリをローカルキャッシュから削除します。
    2. ループを続行します。
  3. その値より大きい場合:
    1. この特定の expressionHashPrefix を expressionHashPrefixes から削除します。
    2. expressionHashes 内の対応する完全なハッシュが、キャッシュエントリにあるかどうかを確認します。
    3. 見つかった場合は、UNSAFE を返します。
    4. 見つからなかった場合は、ループを続けます。
3. キャッシュエントリが見つからない場合は、ループを続けます。
expressionHashPrefixes の expressionHashPrefix ごとに次の操作を行います。
1. ローカル脅威リストのデータベースで expressionHashPrefix を検索します。
2. expressionHashPrefix がローカル脅威リストのデータベースで見つからない場合は、expressionHashPrefixes から削除します。
RPC SearchHashes または REST メソッド hashes.search を使用して、expressionHashPrefixes を Google セーフブラウジング v5 サーバーに送信します。エラー（ネットワークエラー、HTTP エラーなど）が発生した場合は、SAFE を返します。それ以外の場合、レスポンスは SB サーバーから受信した response とします。これは、脅威の性質（ソーシャルエンジニアリング、マルウェアなど）を特定する補助情報とともに完全なハッシュのリストと、キャッシュの有効期限 expiration です。
response の fullHash ごとに次の操作を行います。
1. fullHash を expiration とともにローカルキャッシュに挿入します。
response の fullHash ごとに次の操作を行います。
1. expressionHashes で fullHash が見つかった結果を isFound とします。
2. isFound が False の場合は、ループを続行します。
3. isFound が True の場合、UNSAFE を返します。
SAFE を返します。

ローカルデータベースを使用しないリアルタイム URL チェック手順

この手順は、クライアントがストレージを使用しないリアルタイムモードを選択した場合に使用されます。

この手順は、単一の URL u を受け取り、SAFE または UNSAFE を返します。

expressions を、URL u によって生成された接尾辞または接頭辞の式のリストとします。
expressionHashes をリストにすると、要素は expressions 内の各式の SHA256 ハッシュです。
expressionHashPrefixes をリストにします。このリストでは、要素は expressionHashes の各ハッシュの最初の 4 バイトです。
expressionHashPrefixes の expressionHashPrefix ごとに次の操作を行います。
1. ローカルキャッシュで expressionHashPrefix を検索します。
2. キャッシュに保存されたエントリが見つかった場合:
  1. 現在の時刻が有効期限より後かどうかを判断します。
  2. 大きい場合:
    1. 検出されたキャッシュエントリをローカルキャッシュから削除します。
    2. ループを続行します。
  3. その値より大きい場合:
    1. この特定の expressionHashPrefix を expressionHashPrefixes から削除します。
    2. expressionHashes 内の対応する完全なハッシュが、キャッシュエントリにあるかどうかを確認します。
    3. 見つかった場合は、UNSAFE を返します。
    4. 見つからなかった場合は、ループを続けます。
3. キャッシュエントリが見つからない場合は、ループを続けます。
RPC SearchHashes または REST メソッド hashes.search を使用して、expressionHashPrefixes を Google セーフブラウジング v5 サーバーに送信します。エラー（ネットワークエラー、HTTP エラーなど）が発生した場合は、SAFE を返します。それ以外の場合、レスポンスは SB サーバーから受信した response とします。これは、脅威の性質（ソーシャルエンジニアリング、マルウェアなど）を特定する補助情報とともに完全なハッシュのリストと、キャッシュの有効期限 expiration です。
response の fullHash ごとに次の操作を行います。
1. fullHash を expiration とともにローカルキャッシュに挿入します。
response の fullHash ごとに次の操作を行います。
1. expressionHashes で fullHash が見つかった結果を isFound とします。
2. isFound が False の場合は、ループを続行します。
3. isFound が True の場合、UNSAFE を返します。
SAFE を返します。

ローカルデータベースのメンテナンス

Google セーフブラウジング v5 では、クライアントがローカルデータベースを維持することを想定しています（ストレージなしリアルタイムモードを選択した場合を除く）。このローカルデータベースの形式とストレージはクライアントによって異なります。このローカルデータベースの内容は、概念的には、さまざまなリストをファイルとして含むフォルダと考えることができます。これらのファイルの内容は、SHA256 ハッシュまたはハッシュプレフィックスです。

データベースの更新

クライアントは定期的に hashList.get メソッドまたは hashLists.batchGet メソッドを呼び出して、データベースを更新します。一般的なクライアントでは一度に複数のリストを更新するため、hashLists.batchGet メソッドを使用することをおすすめします。

リストは個別の名前で識別されます。名前は数文字の短い ASCII 文字列です。

脅威の種類、プラットフォームの種類、脅威のエントリの種類のタプルによってリストが識別される V4 とは異なり、v5 のリストでは単に名前で識別されます。これにより、複数の v5 リストが同じ脅威タイプを共有している場合に柔軟に対応できます。プラットフォームタイプと脅威エントリタイプは v5 で削除されます。

いったんリストの名前を選択すると、名前は変更されません。また、一度表示されたリストは削除されません（そのリストが有用でなくなった場合は空になりますが、存在し続けます）。そのため、こうした名前は Google セーフブラウジングのクライアントコードにハードコードすることをおすすめします。

hashList.get メソッドと hashLists.batchGet メソッドはどちらも、増分更新をサポートしています。増分アップデートを使用すると、帯域幅を節約でき、パフォーマンスが向上します。増分更新は、クライアントのリストのバージョンとリストの最新バージョンの間で差分を取得することで機能します。（クライアントが新しくデプロイされ、利用可能なバージョンがない場合は、フルアップデートを利用できます）。増分アップデートには、削除のインデックスと追加が含まれています。クライアントはまず、指定されたインデックスのエントリをローカルデータベースから削除してから、その追加を適用することが求められます。

最後に、破損を防ぐため、クライアントは保存されたデータをサーバーが提供するチェックサムと照合する必要があります。チェックサムが一致しない場合、クライアントはフルアップデートを実行する必要があります。

リストコンテンツのデコード

リストはすべて、サイズを小さくするために特別なエンコードを使用して配信されます。このエンコードは、Google セーフブラウジングリストに概念的には、統計的にランダムな整数と区別できないハッシュまたはハッシュプレフィックスが含まれていることを認識することで行われます。これらの整数を並べ替えて隣接差分を取得すると、そのような隣接差分はある意味「小さい」と予想されます。Golomb-Rice エンコードはこの小さい性を悪用します。

Google セーフブラウジング v5 には、4 バイトのデータ、8 バイトのデータ、16 バイトのデータ、32 バイトのデータを扱う 4 種類のデータがあります。数値的に連続する 3 つの 4 バイトの整数がエンコードされる例を見てみましょう。k で表される Rice パラメータを 3 とします。エンコードの商の部分は、単に k ビットだけ右にシフトされた隣接差分値です。与えられた整数は連続しているため、隣接する差分は 1 になり、3 ビットシフトした後の商部はゼロになります。最下位 k ビットは 001 です。商ゼロは単一の 0 ビットとしてエンコードされます。余りは 1 で、100 にエンコードされます。これを繰り返して、ビットストリーム 01000100 を形成する。結果のビットストリームは、リトルエンディアンを使用して 00100010 としてエンコードされます。したがって、次のデータに対応します。

rice_parameter: 3
entries_count: 2
encoded_data: "\x22"

上記の 32 ビット整数のデコードステップの後、結果は除去インデックスまたは追加のいずれかとして直接使用可能です。v4 とは異なり、後でバイトスワップを実行する必要はありません。

使用可能なリスト

v5alpha1 では、次のリストを使用することをおすすめします。

リスト名	対応する v4 `ThreatType` 列挙型	説明
`gc`	一切届かない	このリストはグローバルキャッシュリストです。リアルタイムモードでのみ使用される特別なリストです。
`se`	`SOCIAL_ENGINEERING`	このリストには、SOCIAL_ENGINEERING 脅威タイプの脅威が含まれています。
`mw`	`MALWARE`	このリストには、デスクトップ・プラットフォームを狙う MALWARE の脅威が含まれています。
`uws`	`UNWANTED_SOFTWARE`	このリストには、デスクトッププラットフォームを対象とする UNWANTED_SOFTWARE 脅威タイプの脅威が含まれています。
`uwsa`	`UNWANTED_SOFTWARE`	このリストには、Android プラットフォームを対象とする UNWANTED_SOFTWARE 脅威タイプの脅威が含まれています。
`pha`	`POTENTIALLY_HARMFUL_APPLICATION`	このリストには、Android プラットフォームを対象とする POTENTIALLY_HARMFUL_APPLICATION 脅威タイプの脅威が含まれています。

別のリストは後日利用可能になり、その時点で上記の表が展開されます。

更新の頻度

クライアントは、minimum_wait_duration フィールドでサーバーによって返された値を調べ、その値を使用してデータベースの次回の更新をスケジュールする必要があります。この値はゼロになる可能性があり、その場合はクライアントはすぐに別の更新を実行する必要があります。

リクエストの例

このセクションでは、HTTP API を直接使用して Google セーフブラウジングにアクセスする例を紹介します。エンコードとデコードが便利な方法で自動的に処理されるため、通常は生成された言語バインディングを使用することをおすすめします。そのバインディングのドキュメントをご覧ください。

hashes.search メソッドを使用した HTTP リクエストの例を次に示します。

GET https://safebrowsing.googleapis.com/v5/hashes:search?key=INSERT_YOUR_API_KEY_HERE&hashPrefixes=WwuJdQ

レスポンスの本文はプロトコルバッファ形式のペイロードであり、後でデコードできます。

hashLists.batchGet メソッドを使用した HTTP リクエストの例を次に示します。

GET https://safebrowsing.googleapis.com/v5alpha1/hashLists:batchGet?key=INSERT_YOUR_API_KEY_HERE&names=se&names=mw

レスポンスの本文は、ここでもデコードできるプロトコルバッファ形式のペイロードです。

移行ガイド

現在 v4 Update API を使用している場合は、ローカルデータベースをリセットまたは消去することなく、v4 から v5 にシームレスに移行できます。このセクションでは、その方法について説明します。

変換リストの更新

v4 では、threatListUpdates.fetch メソッドを使用してリストをダウンロードします。v5 では、hashLists.batchGet メソッドに切り替わります。

リクエストに次の変更を行う必要があります。

v4 ClientInfo オブジェクトを完全に削除します。専用のフィールドを使用してクライアントの ID を指定する代わりに、既知の User-Agent ヘッダーを使用します。このヘッダーにクライアント ID を入力するための所定の形式はありませんが、元のクライアント ID とクライアントバージョンをスペースまたはスラッシュで区切って指定することをおすすめします。
v4 ListUpdateRequest オブジェクトごとに、次の操作を行います。
- 上の表で対応する v5 リスト名を検索し、その名前を v5 リクエストで指定します。
- threat_entry_type や platform_type などの不要なフィールドを削除します。
- v4 の state フィールドは、v5 の versions フィールドと直接互換性があります。v4 で state フィールドを使用してサーバーに送信されるバイト文字列と同じバイト文字列を、v5 では versions フィールドを使用して簡単に送信できます。
- v4 の制約の場合、v5 では SizeConstraints という簡素化されたバージョンが使用されます。その他のフィールド（region など）は削除する必要があります。

レスポンスを次のように変更する必要があります。

v4 の enum ResponseType は、単純に partial_update という名前のブール値フィールドに置き換えられました。
minimum_wait_duration フィールドは、ゼロにすることも、省略することもできるようになりました。有効の場合、クライアントは直ちに別のリクエストを行うよう求められます。これは、クライアントが SizeConstraints で最大更新サイズに対する最大データベースサイズよりも小さい制約を指定した場合にのみ発生します。
32 ビット整数の Rice デコードアルゴリズムを調整する必要があります。違いは、エンコードされたデータが異なるエンディアンでエンコードされることです。v4 と v5 の両方で、32 ビットのハッシュプレフィックスは辞書順に並べ替えられます。ただし、v4 では、これらの接頭辞は並べ替えたときにリトルエンディアンとして扱われますが、v5 では、接頭辞は並べ替えたときにビッグエンディアンとして扱われます。つまり、辞書順による並べ替えはビッグエンディアンによる数値の並べ替えと同じであるため、クライアント側で並べ替えを行う必要はありません。Chromium v4 の実装におけるこのような形式の例については、こちらをご覧ください。このような並べ替えは解除できます。
他のハッシュ長については、Rice デコードアルゴリズムを実装する必要があります。

ハッシュ検索の変換

v4 では、fullHashes.find メソッドを使用して完全なハッシュを取得します。v5 の同等のメソッドは、hashes.search メソッドです。