本文件適用於下列方法:Update API (第 4 版):fullHashes.find。
總覽
安全瀏覽清單包含長度可變的 SHA256 雜湊 (請參閱「清單內容」)。如要根據「安全瀏覽」清單 (無論在本機或伺服器上) 檢查網址,用戶端必須先 會計算該網址的雜湊前置字串
如要計算網址的雜湊字首,請按照下列步驟操作:
- 將網址標準化 (請參閱標準化)。
- 為網址建立字尾/前置字串運算式 (請參閱後置/前置字元運算式)。
- 計算每個後置字元/前置字串運算式的完整雜湊值 (請參閱雜湊運算)。
- 計算每個完整雜湊的雜湊前置字串 (請參閱雜湊前置字串運算)。
請注意,以下步驟反映了安全瀏覽伺服器用於維護安全瀏覽功能的程序 瀏覽清單。
標準化
首先,我們假設用戶端已剖析網址,並根據 RFC 2396 使網址有效。 如果網址使用國際化網域名稱 (IDN),用戶端應將網址轉換為 ASCII 域名代碼 (Punycode) 表示法。網址必須包含路徑元件;也就是必須要有 結尾斜線 (「http://google.com/」)。
首先,請移除 網址。請勿移除這些字元的逸出序列 (例如「%0a」)。
其次,如果網址結束於片段,請移除該片段。例如將「http://google.com/#frag」縮短為「http://google.com/」。
第三,重複執行百分比逸出作業,直到網址不再有百分號逸出為止。
如何標準化主機名稱:
從網址中擷取主機名稱,然後:
- 移除開頭和結尾的所有點。
- 以單一點取代連續點。
- 如果主機名稱可剖析為 IP 位址,請將其正規化 到 4 個以點分隔的十進位值用戶端應處理任何合法的 IP 位址編碼,包括八進制、十六進制和少於四個元件的編碼。
- 將整個字串小寫。
如要標準化路徑:
- 解析序列「/../」和「/./」在這個路徑中 取代「/./」取代為「/」,並移除「/../」以及前一個路徑 元件。
- 以單一斜線字元取代連續斜線字元。
請勿將這些路徑標準化方式套用至查詢參數。
網址中的所有字元 (百分比逸出) 的值為 <= ASCII 32、>= 127、「#」或「%」。逸出應使用 大寫十六進位字元。
以下是可協助驗證標準化實作方式的測試。
Canonicalize("http://host/%25%32%35") = "http://host/%25"; Canonicalize("http://host/%25%32%35%25%32%35") = "http://host/%25%25"; Canonicalize("http://host/%2525252525252525") = "http://host/%25"; Canonicalize("http://host/asdf%25%32%35asd") = "http://host/asdf%25asd"; Canonicalize("http://host/%%%25%32%35asd%%") = "http://host/%25%25%25asd%25%25"; Canonicalize("http://www.google.com/") = "http://www.google.com/"; Canonicalize("http://%31%36%38%2e%31%38%38%2e%39%39%2e%32%36/%2E%73%65%63%75%72%65/%77%77%77%2E%65%62%61%79%2E%63%6F%6D/") = "http://168.188.99.26/.secure/www.ebay.com/"; Canonicalize("http://195.127.0.11/uploads/%20%20%20%20/.verify/.eBaysecure=updateuserdataxplimnbqmn-xplmvalidateinfoswqpcmlx=hgplmcx/") = "http://195.127.0.11/uploads/%20%20%20%20/.verify/.eBaysecure=updateuserdataxplimnbqmn-xplmvalidateinfoswqpcmlx=hgplmcx/"; Canonicalize("http://host%23.com/%257Ea%2521b%2540c%2523d%2524e%25f%255E00%252611%252A22%252833%252944_55%252B") = "http://host%23.com/~a!b@c%23d$e%25f^00&11*22(33)44_55+"; Canonicalize("http://3279880203/blah") = "http://195.127.0.11/blah"; Canonicalize("http://www.google.com/blah/..") = "http://www.google.com/"; Canonicalize("www.google.com/") = "http://www.google.com/"; Canonicalize("www.google.com") = "http://www.google.com/"; Canonicalize("http://www.evil.com/blah#frag") = "http://www.evil.com/blah"; Canonicalize("http://www.GOOgle.com/") = "http://www.google.com/"; Canonicalize("http://www.google.com.../") = "http://www.google.com/"; Canonicalize("http://www.google.com/foo\tbar\rbaz\n2") ="http://www.google.com/foobarbaz2"; Canonicalize("http://www.google.com/q?") = "http://www.google.com/q?"; Canonicalize("http://www.google.com/q?r?") = "http://www.google.com/q?r?"; Canonicalize("http://www.google.com/q?r?s") = "http://www.google.com/q?r?s"; Canonicalize("http://evil.com/foo#bar#baz") = "http://evil.com/foo"; Canonicalize("http://evil.com/foo;") = "http://evil.com/foo;"; Canonicalize("http://evil.com/foo?bar;") = "http://evil.com/foo?bar;"; Canonicalize("http://\x01\x80.com/") = "http://%01%80.com/"; Canonicalize("http://notrailingslash.com") = "http://notrailingslash.com/"; Canonicalize("http://www.gotaport.com:1234/") = "http://www.gotaport.com/"; Canonicalize(" http://www.google.com/ ") = "http://www.google.com/"; Canonicalize("http:// leadingspace.com/") = "http://%20leadingspace.com/"; Canonicalize("http://%20leadingspace.com/") = "http://%20leadingspace.com/"; Canonicalize("%20leadingspace.com/") = "http://%20leadingspace.com/"; Canonicalize("https://www.securesite.com/") = "https://www.securesite.com/"; Canonicalize("http://host.com/ab%23cd") = "http://host.com/ab%23cd"; Canonicalize("http://host.com//twoslashes?more//slashes") = "http://host.com/twoslashes?more//slashes";
後置字串/前置字元運算式
將網址標準化後,下一步是建立後置字元/前置字串運算式。每項 後置字串/前置字串運算式是由主機後置字串 (或完整主機) 和路徑前置字串 (或完整路徑) 組成。 讓模型就緒
後置字元/前置字元運算式 | 等效的規則運算式 |
---|---|
a.b/mypath/ | http\:\/\/.*\.a\.b\/mypath\/.* |
c.d/full/path.html?myparam=a | http\:\/\/.*.c\.d\/full\/path\.html?myparam=a |
用戶端最多可組合 30 個主機後置字元和路徑前置字元組合。這些組合只會使用網址的主機和路徑元件。系統會捨棄配置、使用者名稱、密碼和通訊埠。如果網址包含查詢參數,請至少 組合會包含完整路徑和查詢參數。
針對主機,用戶端最多將嘗試五個不同的字串。這 3 個子類型如下:
- 網址中的確切主機名稱。
- 最多可形成四個主機名稱,從最後五個元件開始,依序移除前導元件。您可以略過頂層網域。這些 如果主機是 IP 位址,請勿檢查其他主機名稱。
對於路徑,用戶端最多會嘗試六個不同的字串。他們 是:
- 網址的確切路徑,包括查詢參數。
- 不含查詢參數的網址確切路徑。
- 從根目錄 (/) 開始,依序附加路徑元件 (包括結尾斜線) 所形成的四個路徑。
以下範例說明檢查行為:
針對 http://a.b.c/1/2.html?param=1
網址,用戶端將嘗試
可能的字串:
a.b.c/1/2.html?param=1 a.b.c/1/2.html a.b.c/ a.b.c/1/ b.c/1/2.html?param=1 b.c/1/2.html b.c/ b.c/1/
針對網址 http://a.b.c.d.e.f.g/1.html
,用戶端會嘗試下列可能的字串:
a.b.c.d.e.f.g/1.html a.b.c.d.e.f.g/ (Note: skip b.c.d.e.f.g, since we'll take only the last five hostname components, and the full hostname) c.d.e.f.g/1.html c.d.e.f.g/ d.e.f.g/1.html d.e.f.g/ e.f.g/1.html e.f.g/ f.g/1.html f.g/
針對 http://1.2.3.4/1/
網址,用戶端會嘗試嘗試
strings:
1.2.3.4/1/ 1.2.3.4/
雜湊運算
建立這組後置字串/前置字串運算式後,下一步就是計算 每個運算式的完整長度 SHA256 雜湊下方提供單元測試 (以偽 C 語言編寫),可用於驗證雜湊運算。
範例: FIPS-180-2:
Unit Test (in pseudo-C) // Example B1 from FIPS-180-2 string input1 = "abc"; string output1 = TruncatedSha256Prefix(input1, 32); int expected1[] = { 0xba, 0x78, 0x16, 0xbf }; assert(output1.size() == 4); // 4 bytes == 32 bits for (int i = 0; i < output1.size(); i++) assert(output1[i] == expected1[i]); // Example B2 from FIPS-180-2 string input2 = "abcdbcdecdefdefgefghfghighijhijkijkljklmklmnlmnomnopnopq"; string output2 = TruncatedSha256Prefix(input2, 48); int expected2[] = { 0x24, 0x8d, 0x6a, 0x61, 0xd2, 0x06 }; assert(output2.size() == 6); for (int i = 0; i < output2.size(); i++) assert(output2[i] == expected2[i]); // Example B3 from FIPS-180-2 string input3(1000000, 'a'); // 'a' repeated a million times string output3 = TruncatedSha256Prefix(input3, 96); int expected3[] = { 0xcd, 0xc7, 0x6e, 0x5c, 0x99, 0x14, 0xfb, 0x92, 0x81, 0xa1, 0xc7, 0xe2 }; assert(output3.size() == 12); for (int i = 0; i < output3.size(); i++) assert(output3[i] == expected3[i]);
雜湊前置字串運算
最後,用戶端需要為每個完整長度的 SHA256 雜湊計算雜湊前置字串。安全無虞 瀏覽時,雜湊前置字串是由 SHA256 雜湊中最重要的 4 到 32 個位元組組成。範例: FIPS-180-2:
- FIPS-180-2 中的範例 B1
- 輸入的是「abc」。
- SHA256 摘要為 ba7816bf 8f01cfea 414140de 5dae2223 b00361a3 96177a9c b410ff61 f20015ad。
- 32 位元雜湊前置字串為 ba7816bf。
- FIPS-180-2 中的範例 B2
- 輸入內容為「abcdbcdecdefdefgefghfghighijhijkijkljklmklmnlmnomnopnopq」。
- SHA256 摘要為 248d6a61 d20638b8 e5c02693 0c3e6039 a33ce459 64ff2167 f6ecedd4 19db06c1。
- 48 位元雜湊前置碼為 248d6a61 d206。