Tài liệu tham khảo API XML

Trang này đề cập đến phiên bản XML của API Tìm kiếm tùy chỉnh JSON, chỉ dành cho Khách hàng của Google Site Search.

  1. Tổng quan
  2. Định dạng yêu cầu của Công cụ tìm kiếm có thể lập trình
    1. Thông tin tổng quan về yêu cầu
    2. Cụm từ tìm kiếm
    3. Tham số của yêu cầu
      1. Cụm từ tìm kiếm mẫu trên WebSearch
      2. Định nghĩa tham số truy vấn WebSearch
      3. Tìm kiếm nâng cao
      4. Tham số truy vấn tìm kiếm nâng cao
      5. Điều khoản truy vấn đặc biệt
      6. Truy vấn hình ảnh mẫu
      7. Tham số truy vấn tìm kiếm hình ảnh
      8. Giới hạn yêu cầu
    4. Quốc tế hoá truy vấn và bản trình bày kết quả
      1. Mã hoá ký tự
      2. Ngôn ngữ giao diện
      3. Tìm kiếm bằng tiếng Trung phồn thể và tiếng Trung giản thể
    5. Lọc kết quả
      1. Tự động lọc kết quả tìm kiếm
      2. Lọc ngôn ngữ và quốc gia
      3. Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
  3. Kết quả XML
    1. DTD Kết quả XML trên Google
    2. Giới thiệu về tính năng Phản hồi XML
    3. Kết quả XML cho Thông thường, Hình ảnh và Cụm từ tìm kiếm nâng cao
      1. Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML
      2. Tìm kiếm thông thường/nâng cao: Thẻ XML
      3. Kết quả XML cho cụm từ tìm kiếm hình ảnh
      4. Tìm kiếm hình ảnh: Truy vấn mẫu và kết quả XML
      5. Tìm kiếm hình ảnh: Thẻ XML

Tổng quan

Dịch vụ Google WebSearch cho phép Google Site Search khách hàng hiển thị kết quả tìm kiếm của Google trên trang web của riêng họ. Chiến lược phát hành đĩa đơn Dịch vụ WebSearch sử dụng một giao thức dựa trên HTTP đơn giản để phục vụ việc tìm kiếm kết quả. Quản trị viên Tìm kiếm có toàn quyền kiểm soát cách thức họ yêu cầu kết quả tìm kiếm và cách chúng hiển thị kết quả cho người dùng cuối. Tài liệu này mô tả chi tiết kỹ thuật của Google yêu cầu tìm kiếm và kết quả.

Để truy xuất kết quả của Google WebSearch, ứng dụng của bạn sẽ gửi Google một yêu cầu HTTP đơn giản. Sau đó, Google sẽ trả về kết quả tìm kiếm ở định dạng XML . Kết quả theo định dạng XML cho phép bạn tuỳ chỉnh cách hiển thị kết quả tìm kiếm.

Định dạng yêu cầu tìm kiếm trên web

Tổng quan về yêu cầu

Yêu cầu tìm kiếm trên Google là một lệnh GET HTTP tiêu chuẩn. Nó bao gồm một tập hợp các thông số có liên quan đến truy vấn. Các thông số này có trong URL yêu cầu dưới dạng name=value các cặp được phân tách bằng ký tự dấu và (&). Các thông số bao gồm như cụm từ tìm kiếm và một mã công cụ duy nhất (cx) giúp xác định đang thực hiện yêu cầu HTTP. Dịch vụ WebSearch hoặc Tìm kiếm hình ảnh trả về Kết quả XML phản hồi các yêu cầu HTTP của bạn.

Cụm từ tìm kiếm

Hầu hết các yêu cầu tìm kiếm đều chứa một hoặc nhiều cụm từ tìm kiếm. Cụm từ truy vấn sẽ xuất hiện dưới dạng giá trị của một thông số trong yêu cầu tìm kiếm.

Cụm từ truy vấn có thể chỉ định một số loại thông tin cần lọc và sắp xếp các kết quả tìm kiếm mà Google trả về. Truy vấn có thể chỉ định:

  • Từ hoặc cụm từ cần bao gồm hoặc loại trừ
    • Tất cả từ trong cụm từ tìm kiếm (mặc định)
    • Cụm từ chính xác trong truy vấn tìm kiếm
    • Bất kỳ từ hoặc cụm từ nào trong cụm từ tìm kiếm
  • Vị trí trong tài liệu để tìm cụm từ tìm kiếm
    • Mọi vị trí trong tài liệu (mặc định)
    • Chỉ trong phần nội dung của tài liệu
    • Chỉ trong tiêu đề tài liệu
    • Chỉ có trong URL của tài liệu
    • Chỉ có trong các đường liên kết của tài liệu
  • Quy định hạn chế đối với những giấy tờ đó
    • Bao gồm hoặc loại trừ tài liệu thuộc các loại tệp cụ thể (như tệp PDF hoặc tài liệu Word)
  • Truy vấn URL đặc biệt trả về thông tin về một URL nhất định, thay vì thực hiện tìm kiếm
    • Các truy vấn trả về thông tin chung về URL, chẳng hạn như danh mục Thư mục mở, đoạn trích hoặc ngôn ngữ
    • Truy vấn trả về tập hợp các trang web liên kết đến một URL
    • Truy vấn trả về một nhóm trang web tương tự như một URL nhất định

Tìm kiếm mặc định

Giá trị tham số truy vấn tìm kiếm phải là ký tự thoát trong URL. Xin lưu ý rằng bạn sẽ thay thế dấu cộng ("+") cho bất kỳ chuỗi khoảng trắng nào trong cụm từ tìm kiếm. Vấn đề này sẽ được thảo luận thêm trong phần Thoát URL của tài liệu này.

Cụm từ truy vấn tìm kiếm được gửi đến dịch vụ WebSearch bằng cách sử dụng tham số q. Đáp cụm từ truy vấn tìm kiếm mẫu là:

q=horses+cows+pigs

Theo mặc định, dịch vụ Google WebSearch chỉ trả về các tài liệu bao gồm tất cả các cụm từ trong truy vấn tìm kiếm.

Tham số yêu cầu

Phần này liệt kê các tham số mà bạn có thể sử dụng khi tạo yêu cầu tìm kiếm. Các thông số được chia thành 2 danh sách. Danh sách đầu tiên chứa các tham số liên quan đến tất cả yêu cầu tìm kiếm. Danh sách thứ hai chứa các tham số là chỉ phù hợp với yêu cầu tìm kiếm nâng cao.

Cần có 3 tham số yêu cầu:

  • Thông số client phải được đặt thành google-csbe
  • Thông số output chỉ định định dạng của kết quả XML được trả về; kết quả có thể được trả về bằng (xml) hoặc không có (xml_no_dtd) tham chiếu đến DTD của Google. Bạn nên đặt giá trị này thành xml_no_dtd. Lưu ý: Nếu bạn không chỉ định thông số này, thì kết quả sẽ được trả về trong HTML thay vì XML.
  • Tham số cx đại diện cho mã duy nhất Mã nhận dạng của công cụ.

Các thông số yêu cầu thường được sử dụng nhất khác với các thông số nêu trên là:

  • num – số lượng kết quả tìm kiếm được yêu cầu
  • q—(các) cụm từ tìm kiếm
  • start – chỉ mục bắt đầu cho kết quả

Truy vấn WebSearch mẫu

Các ví dụ bên dưới minh hoạ một số yêu cầu HTTP của WebSearch để minh hoạ cách sử dụng các tham số truy vấn. Định nghĩa của các tham số truy vấn khác nhau được cung cấp trong giao diện Truy vấn WebSearch Định nghĩa thông sốTruy vấn tìm kiếm nâng cao Các phần Thông số trong tài liệu này.

Yêu cầu này cần 10 kết quả đầu tiên (start=0&num=10) cho cụm từ truy vấn "red sox" (q=red+sox). Truy vấn này cũng chỉ định rằng kết quả phải đến từ các trang web của Canada (cr=countryCA) và phải được viết bằng tiếng Pháp (lr=lang_fr). Cuối cùng, truy vấn chỉ định các giá trị cho máy khách, đầu ra, và cx, cả ba đều bắt buộc.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Ví dụ này sử dụng một số truy vấn tìm kiếm nâng cao tham số để tuỳ chỉnh thêm cho cụm từ tìm kiếm. Yêu cầu này sử dụng thuộc tính as_q (as_q=red+sox) thay vì thông số q. Công cụ này cũng sử dụng as_eq để loại trừ mọi tài liệu có chứa từ "Yankees" từ kết quả tìm kiếm (as_eq=yankees).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Định nghĩa tham số truy vấn WebSearch

c2coff
Nội dung mô tả

Không bắt buộc. Thông số c2coff bật hoặc tắt tính năng Đơn giản hoá và tính năng Tìm kiếm bằng tiếng Trung phồn thể.

Giá trị mặc định cho tham số này là 0 (không), nghĩa là khi tính năng này được bật. Các giá trị cho tham số c2coff là:

Giá trị Hành động
1 Đã tắt
0 Đang bật
Ví dụ q=google&c2coff=1

khách hàng
Nội dung mô tả

Bắt buộc. Tham số client phải được đặt thành google-csbe.

Ví dụ q=google&client=google-csbe

cr
Nội dung mô tả

Không bắt buộc. Tham số cr giới hạn kết quả tìm kiếm đối với các tài liệu bắt nguồn bằng quốc gia cụ thể. Bạn có thể dùng hàm Boolean các toán tử trong tham số cr giá trị.

Google WebSearch xác định quốc gia của một tài liệu bằng cách đang phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • vị trí địa lý của địa chỉ IP của máy chủ Web

Xem thông số Quốc gia (cr) Giá trị để xem danh sách các giá trị hợp lệ cho thông số này.

Ví dụ q=Frodo&cr=countryNZ

CX
Nội dung mô tả

Bắt buộc. Tham số cx chỉ định một duy nhất mã xác định một thuộc tính tùy chỉnh công cụ tìm kiếm. Bạn phải chỉ định một Công cụ tìm kiếm có thể lập trình bằng cách sử dụng tham số cx để truy xuất kết quả tìm kiếm qua công cụ đó.

Để tìm giá trị của tham số cx, hãy chuyển đến Control Panel (Bảng điều khiển) > Mã tab của công cụ và bạn sẽ tìm thấy công cụ đó trong vùng văn bản trong 'Dán mã này vào trang mà bạn muốn hộp tìm kiếm của mình xuất hiện. Kết quả tìm kiếm sẽ được hiển thị trên trang được lưu trữ trên Google."

Ví dụ q=Frodo&cx=00255077836266642015:u-scht7a-8i

filter
Nội dung mô tả

Không bắt buộc. Thông số filter sẽ kích hoạt hoặc tắt tính năng lọc tự động kết quả tìm kiếm của Google. Xem phần Lọc tự động trong bài viết này tài liệu này để biết thêm thông tin về bộ lọc kết quả tìm kiếm của Google.

Giá trị mặc định cho tham số filter1, cho biết tính năng này đã được bật. Giá trị hợp lệ cho thuộc tính này tham số là:

Giá trị Hành động
1 Đã tắt
0 Đang bật

Lưu ý: Theo mặc định, Google áp dụng tính năng lọc cho tất cả kết quả tìm kiếm để cải thiện chất lượng của những kết quả đó.

Ví dụ q=google&filter=0

gl
Nội dung mô tả

Không bắt buộc. Giá trị tham số gl là một mã quốc gia gồm hai chữ cái. Đối với kết quả trên WebSearch, tham số gl sẽ tăng cường các kết quả tìm kiếm có quốc gia xuất xứ khớp với giá trị tham số. Hãy xem phần Mã quốc gia để biết danh sách các giá trị hợp lệ.

Chỉ định giá trị tham số gl trong các yêu cầu WebSearch sẽ cải thiện mức độ liên quan của kết quả. Điều này đặc biệt đúng với khách hàng quốc tế và thậm chí cụ thể hơn là khách hàng ở các quốc gia nói tiếng Anh khác ngoài Hoa Kỳ.

Ví dụ

Yêu cầu này tăng cường tài liệu được viết ở Vương quốc Anh bằng Kết quả WebSearch:
q=pizza&gl=uk


hl
Nội dung mô tả

Không bắt buộc. Tham số hl chỉ định ngôn ngữ giao diện (ngôn ngữ máy chủ) của giao diện người dùng. Để cải thiện hiệu suất và chất lượng của kết quả tìm kiếm, thì bạn có thể bạn nên đặt thông số này một cách rõ ràng.

Xem phần Ngôn ngữ giao diện của Quốc tế hóa truy vấn và Bản trình bày kết quả để biết thêm thông tin và Ngôn ngữ giao diện được hỗ trợ để xem danh sách các ngôn ngữ được hỗ trợ.

Ví dụ

Yêu cầu này nhắm mục tiêu quảng cáo về rượu vang bằng tiếng Pháp. (Vin là thuật ngữ rượu vang của Pháp.)

q=vin&ip=10.10.10.10&ad=w5&hl=fr

chất lượng cao
Nội dung mô tả

Không bắt buộc. Tham số hq sẽ thêm các cụm từ truy vấn được chỉ định vào truy vấn như thể chúng được kết hợp với toán tử logic AND.

Ví dụ

Yêu cầu này tìm kiếm từ khóa 'pizza' VÀ "phô mai". Biểu thức này giống với q=pizza+cheese.

q=pizza&hq=cheese


ie
Nội dung mô tả

Không bắt buộc. Tham số ie đặt ký tự định dạng mã hoá nên được sử dụng để diễn giải chuỗi truy vấn. Chiến lược phát hành đĩa đơn giá trị ie mặc định là latin1.

Xem phần Character Encoding (Mã hóa ký tự) để thảo luận về thời điểm bạn có thể cần phải sử dụng thông số này.

Xem phần Mã hoá ký tự Lược đồ cho danh sách các giá trị ie có thể có.

Ví dụ q=google&ie=utf8&oe=utf8
lr
Nội dung mô tả

Không bắt buộc. Tham số lr (giới hạn ngôn ngữ) giới hạn kết quả tìm kiếm ở các tài liệu được viết bằng một ngôn ngữ cụ thể.

Google WebSearch xác định ngôn ngữ của tài liệu bằng cách đang phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • thẻ meta về ngôn ngữ trong tài liệu
  • ngôn ngữ chính được dùng trong nội dung của tài liệu
  • ngôn ngữ phụ, nếu có, được sử dụng trong nội dung của tài liệu

Xem Ngôn ngữ (lr) Giá trị của bộ sưu tập để xem danh sách các giá trị hợp lệ cho thuộc tính này .

Ví dụ q=Frodo&lr=lang_en

số
Nội dung mô tả

Không bắt buộc. Tham số num xác định số lượng kết quả tìm kiếm cần trả về.

Giá trị num mặc định là 10 và là giá trị tối đa giá trị là 20. Nếu bạn yêu cầu hơn 20 kết quả, thì chỉ có 20 kết quả kết quả sẽ được trả về.

Lưu ý: Nếu tổng số kết quả tìm kiếm ít hơn nhiều hơn số lượng kết quả được yêu cầu, tất cả kết quả tìm kiếm có sẵn sẽ bị trả lại.

Ví dụ q=google&num=10

oe
Nội dung mô tả

Không bắt buộc. Tham số oe đặt ký tự lược đồ mã hoá cần sử dụng để giải mã kết quả XML. Chiến lược phát hành đĩa đơn giá trị oe mặc định là latin1.

Xem phần Character Encoding (Mã hóa ký tự) để thảo luận về thời điểm bạn có thể cần phải sử dụng thông số này.

Xem phần Mã hoá ký tự Lược đồ cho danh sách các giá trị oe có thể có.

Ví dụ q=google&ie=utf8&oe=utf8

output
Nội dung mô tả

Bắt buộc. Tham số output chỉ định định dạng của kết quả XML. Chỉ số hợp lệ các giá trị cho tham số này là xmlxml_no_dtd. Chiến lược phát hành đĩa đơn biểu đồ bên dưới giải thích sự khác biệt của các giá trị thông số này.

Giá trị Định dạng Trang kết quả
xml_no_dtd Kết quả XML sẽ không bao gồm !DOCTYPE của bạn. (Nên dùng)
xml Kết quả XML sẽ chứa Tham chiếu DTD. Dòng thứ hai của kết quả sẽ xác định tài liệu loại định nghĩa (DTD) mà kết quả sử dụng:
    <!DOCTYPE GSP SYSTEM "google.dtd">
Ví dụ output=xml_no_dtd
output=xml

q
Nội dung mô tả

Không bắt buộc. Tham số q chỉ định cụm từ tìm kiếm truy vấn do người dùng nhập. Mặc dù tham số này là không bắt buộc, nhưng bạn phải chỉ định giá trị cho ít nhất một trong các tham số truy vấn (as_epq, as_lq, as_oq, as_q để nhận kết quả tìm kiếm.

Ngoài ra còn có một số cụm từ truy vấn đặc biệt có thể được dùng trong tham số q giá trị. Vui lòng xem Điều khoản truy vấn đặc biệt để biết danh sách và định nghĩa của các thuật ngữ này.

Bảng điều khiển Google Tìm kiếm bao gồm một báo cáo về các truy vấn được gửi bằng cách sử dụng thông số q.

Lưu ý: Giá trị được chỉ định cho thông số q phải sử dụng ký tự thoát trong URL.

Ví dụ q=vacation&as_oq=london+paris

an toàn
Nội dung mô tả

Không bắt buộc. Tham số safe cho biết cách lọc kết quả tìm kiếm đối với người lớn và nội dung khiêu dâm. Giá trị mặc định cho tham số safeoff. Giá trị thông số hợp lệ là:

Giá trị Hành động
off Tắt tính năng Tìm kiếm an toàn
medium Bật tính năng Tìm kiếm an toàn
high Bật phiên bản Tìm kiếm an toàn nghiêm ngặt hơn

Xem phần Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn để biết thêm thông tin chi tiết về tính năng này.

Ví dụ q=adult&safe=high

bắt đầu
Nội dung mô tả

Không bắt buộc. Tham số start cho biết kết quả khớp đầu tiên cần được đưa vào trong kết quả tìm kiếm. Tham số start sử dụng chỉ mục gốc 0, nghĩa là kết quả đầu tiên là 0, kết quả thứ hai là 1, v.v.

Tham số start hoạt động trong kết hợp với tham số num để xác định kết quả tìm kiếm nào cần trả về. Lưu ý rằng sẽ không có quá 1000 kết quả được trả về cho bất kỳ truy vấn nào, ngay cả khi có hơn 1000 tài liệu phù hợp với truy vấn, do đó việc đặt bắt đầu bằng 1000 trở lên sẽ không tạo ra kết quả nào.

Ví dụ start=10

sắp xếp
Nội dung mô tả

Không bắt buộc. Tham số sort chỉ định rằng kết quả được sắp xếp theo biểu thức đã chỉ định. Ví dụ: sắp xếp theo ngày.

Ví dụ

sort=date


ud
Nội dung mô tả

Không bắt buộc. Tham số ud cho biết xem phản hồi XML có bao gồm URL được mã hoá bằng IDN cho kết quả tìm kiếm hay không. Phương thức mã hoá IDN (Tên miền quốc tế) cho phép miền hiển thị bằng cách sử dụng ngôn ngữ, ví dụ:

http://www.花井鮨.com

Các giá trị hợp lệ cho tham số này là 1 (mặc định), có nghĩa là kết quả XML sẽ bao gồm các URL được mã hoá bằng IDN và 0, nghĩa là kết quả XML không được bao gồm các URL được mã hoá bằng IDN URL. Nếu bạn đặt tham số ud thành 1, thì URL được mã hoá bằng IDN sẽ xuất hiện trong trong thẻ UD trong kết quả XML.

Nếu tham số ud được đặt thành 0, URL trong ví dụ ở trên sẽ là được hiển thị dưới dạng:

http://www.xn--elq438j.com.

Lưu ý: Đây là tính năng thử nghiệm.

Ví dụ q=google&ud=1

Tham số truy vấn bổ sung được liệt kê bên dưới hình ảnh có liên quan đến các truy vấn tìm kiếm nâng cao. Khi bạn gửi nội dung tìm kiếm nâng cao, giá trị của một vài thông số (ví dụ: as_eq, as_epq, as_oq, v.v.) đều được tính vào truy vấn cho nội dung tìm kiếm đó. Hình ảnh thể hiện trang Tìm kiếm nâng cao của Google. Trên hình ảnh, tên của từng biến thông số tìm kiếm nâng cao được viết bằng văn bản màu đỏ bên trong hoặc bên cạnh trường trên trang tương ứng với thông số đó.



Tham số truy vấn tìm kiếm nâng cao

as_dt
Nội dung mô tả

Không bắt buộc. Tham số as_dt kiểm soát việc để bao gồm hoặc loại trừ kết quả từ trang web có tên trong tham số as_sitesearch. Chiến lược phát hành đĩa đơn các giá trị ie lần lượt biểu thị bao gồm và loại trừ.

Ví dụ as_dt=i,as_dt=e

as_epq
Nội dung mô tả

Không bắt buộc. Tham số as_epq xác định một mà tất cả tài liệu trong kết quả tìm kiếm đều phải có. Bạn có thể cũng sử dụng cụm từ truy vấn tìm kiếm theo cụm từ để tìm kiếm một cụm từ.

Ví dụ as_epq=abraham+lincoln

as_eq
Nội dung mô tả

Không bắt buộc. Tham số as_eq xác định một từ hoặc cụm từ không nên xuất hiện trong bất kỳ tài liệu nào trong tìm kiếm kết quả. Bạn cũng có thể sử dụng truy vấn loại trừ để đảm bảo rằng một từ hoặc cụm từ cụ thể sẽ không xuất hiện trong tài liệu trong một tập hợp kết quả tìm kiếm.

Ví dụ

q=bass&as_eq=music.


as_lq
Nội dung mô tả

Không bắt buộc. Tham số as_lq chỉ định rằng tất cả kết quả tìm kiếm đều nên chứa liên kết đến một URL cụ thể. Bạn cũng có thể sử dụng cụm từ truy vấn link: cho loại truy vấn này.

Ví dụ

as_lq=www.google.com


as_nlo
Nội dung mô tả

Không bắt buộc. Tham số as_nlo chỉ định giá trị bắt đầu cho một phạm vi tìm kiếm. Sử dụng as_nloas_nhi để thêm một cụm từ tìm kiếm tổng hợp phạm vi as_nlo...as_nhi vào truy vấn.

Ví dụ

Phần sau đây đặt phạm vi tìm kiếm từ 5 đến 10, bao gồm:

as_nlo=5&as_nhi=10

as_nhi
Nội dung mô tả

Không bắt buộc. Tham số as_nhi chỉ định giá trị cuối cùng cho phạm vi tìm kiếm. Sử dụng as_nloas_nhi để thêm một phạm vi tìm kiếm bao gồm as_nlo...as_nhi vào truy vấn.

Ví dụ

Phần sau đây đặt phạm vi tìm kiếm từ 5 đến 10, bao gồm:

as_nlo=5&as_nhi=10

as_oq
Nội dung mô tả

Không bắt buộc. Tham số as_oq cung cấp các cụm từ tìm kiếm bổ sung để kiểm tra trong một tài liệu, trong đó mỗi tài liệu phải chứa ít nhất một trong số các thuộc tính bổ sung cụm từ tìm kiếm. Bạn cũng có thể sử dụng cụm từ truy vấn Boolean OR cho loại truy vấn này.

Ví dụ

q=vacation&as_oq=London+Paris


as_q
Nội dung mô tả

Không bắt buộc. Tham số as_q cung cấp chức năng tìm kiếm các thuật ngữ cần kiểm tra trong một tài liệu. Tham số này cũng thường được sử dụng để cho phép người dùng chỉ định các cụm từ bổ sung để tìm kiếm trong một nhóm kết quả tìm kiếm.

Ví dụ

q=president&as_q=John+Adams


as_qdr
Nội dung mô tả

Không bắt buộc. Tham số as_qdr yêu cầu tìm kiếm kết quả từ một khoảng thời gian chỉ định (phạm vi ngày nhanh). Các giá trị sau được hỗ trợ:

d[number] yêu cầu kết quả từ số ngày đã chỉ định trong quá khứ.
w[number] yêu cầu kết quả từ số tuần được chỉ định trước đó.
m[number] yêu cầu kết quả từ số tháng được chỉ định trong quá khứ.
y[number] yêu cầu kết quả từ số năm được chỉ định trong quá khứ.

Ví dụ

Ví dụ sau yêu cầu kết quả từ năm ngoái:

as_qdr=y

Ví dụ sau yêu cầu kết quả trong 10 ngày qua:

as_qdr=d10

as_sitesearch
Nội dung mô tả

Không bắt buộc. Tham số as_sitesearch cho phép bạn chỉ định rằng tất cả kết quả tìm kiếm đều phải là các trang thuộc một trang web nhất định. Bằng cách đặt tham số as_dt, bạn cũng có thể sử dụng tham số này để loại trừ các trang thuộc một trang web nhất định khỏi kết quả tìm kiếm.

Ví dụ

q=vacation&as_sitesearch=www.google.com


Điều khoản truy vấn đặc biệt

Google WebSearch cho phép sử dụng một số cụm từ truy vấn đặc biệt sử dụng các chức năng bổ sung của công cụ tìm kiếm Google. Các các cụm từ truy vấn đặc biệt phải được đưa vào giá trị của tham số yêu cầu q. Giống như các cụm từ truy vấn khác, cụm từ truy vấn đặc biệt phải là ký tự thoát URL. Đáp số cụm từ truy vấn đặc biệt có chứa dấu hai chấm (:). Nhân vật này cũng phải là ký tự thoát URL; giá trị thoát URL là %3A.

Đường liên kết ngược [link:]
Nội dung mô tả

Cụm từ truy vấn link: truy xuất tập hợp các trang Web liên kết đến một URL cụ thể. Cụm từ tìm kiếm phải được định dạng là link:URL, không có dấu cách giữa cụm từ tìm kiếm link: và URL.

Phiên bản thoát URL của link:link%3A.

Bạn cũng có thể sử dụng yêu cầu as_lq để gửi yêu cầu link:.

Lưu ý: Bạn không thể chỉ định bất kỳ cụm từ truy vấn nào khác khi đang sử dụng link:.

Ví dụ

http://www.google.com/search?q=link%3Awww.example.com


Tìm kiếm bằng Boolean HOẶC [ HOẶC ]
Nội dung mô tả

Cụm từ truy vấn OR truy xuất các tài liệu có chứa một của một loạt (hai hoặc nhiều) cụm từ truy vấn. Để sử dụng truy vấn OR bạn cần chèn cụm từ tìm kiếm OR, bằng chữ in hoa các chữ cái, giữa mỗi thuật ngữ trong chuỗi.

Bạn cũng có thể sử dụng yêu cầu as_oq để gửi tìm kiếm bất kỳ cụm từ nào trong một tập hợp các cụm từ.

Lưu ý: Nếu một yêu cầu tìm kiếm chỉ định cụm từ tìm kiếm "London+OR+ Paris", thì kết quả tìm kiếm sẽ bao gồm tài liệu có chứa ít nhất một trong hai từ đó. Trong một số trường hợp, tài liệu trong kết quả tìm kiếm có thể chứa cả hai từ.

Ví dụ

Tìm kiếm London hoặc Paris:

Thông tin do người dùng nhập:london OR paris Cụm từ tìm kiếm:q=london+OR+paris

Tìm kỳ nghỉ tại London hoặc Paris:

Cụm từ truy vấn:q=vacation+london+OR+paris

Tìm kiếm kỳ nghỉ và một trong số các tùy chọn tại London, Paris hoặc sô cô la:

Cụm từ truy vấn:  q=vacation+london+OR+paris+OR+chocolates

Tìm kiếm kỳ nghỉ và sô cô la, London hoặc paris, có trọng lượng ít nhất cho sô cô la:

Cụm từ truy vấn:  q=vacation+london+OR+paris+chocolates

Tìm kiếm kỳ nghỉ, sô cô la và hoa trong các tài liệu cũng chứa London hoặc Paris:

Cụm từ truy vấn:  q=vacation+london+OR+paris+chocolates+flowers

Tìm kiếm kỳ nghỉ và một trong các địa điểm tại London hoặc Paris, đồng thời tìm kiếm cho một trong những sô cô la hoặc hoa:

Cụm từ truy vấn:  q=vacation+london+OR+paris+chocolates+OR+flowers

Loại trừ cụm từ truy vấn [-]
Nội dung mô tả

Cụm từ truy vấn loại trừ (-) hạn chế kết quả cho một yêu cầu tìm kiếm cụ thể đối với các tài liệu không chứa từ hoặc cụm từ cụ thể. Để sử dụng cụm từ truy vấn loại trừ, bạn sẽ mở đầu từ hoặc cụm từ cần loại trừ khỏi các tài liệu phù hợp bằng "-" (dấu trừ).

Phiên bản thoát URL của -%2D.

Loại trừ cụm từ truy vấn sẽ hữu ích khi cụm từ tìm kiếm có nhiều nhiều nghĩa. Ví dụ: từ "bass" có thể trả về kết quả về cá hoặc âm nhạc. Nếu bạn đang tìm tài liệu về cá, bạn có thể loại trừ tài liệu về âm nhạc khỏi kết quả tìm kiếm của mình bằng cách sử dụng cụm từ truy vấn loại trừ.

Bạn cũng có thể sử dụng yêu cầu as_eq tham số để loại trừ những tài liệu khớp với một từ hoặc cụm từ cụ thể khỏi kết quả tìm kiếm.

Ví dụ Dữ liệu do người dùng nhập: bass -music
Cụm từ truy vấn: q=bass+%2Dmusic

Loại trừ loại tệp [ -loại tệp: ]
Nội dung mô tả

Cụm từ truy vấn -filetype: loại trừ những tài liệu có đuôi tệp cụ thể, chẳng hạn như ".pdf" hoặc ".doc" từ tìm kiếm kết quả. Cụm từ tìm kiếm phải được định dạng là -filetype:EXTENSION và không có dấu cách giữa cụm từ tìm kiếm -filetype: và tiện ích đã chỉ định.

Phiên bản thoát URL của -filetype:%2Dfiletype%3A.

Lưu ý:Bạn có thể loại trừ nhiều loại tệp từ kết quả tìm kiếm bằng cách thêm truy vấn -filetype: khác vào truy vấn của bạn. Bạn nên có một cụm từ truy vấn -filetype: trong truy vấn tìm kiếm của bạn cho từng đuôi tệp cần loại trừ khỏi kết quả tìm kiếm.

Các loại tệp được Google hỗ trợ bao gồm:

  • Định dạng tài liệu di động Adobe (pdf)
  • Adobe PostScript (ps)
  • Sen 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Sen WordPro (lupp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản đa dạng thức (rtf)
  • Shockwave Flash (ưa thích )
  • Văn bản (ans, txt).

Sau này, chúng tôi có thể sẽ thêm các loại tệp khác. Trường hợp cập nhật luôn có thể tìm thấy trong phần Câu hỏi thường gặp về loại tệp của Google.

Ví dụ

Ví dụ này trả về tài liệu có nhắc đến "Google" nhưng điều đó không phải là tài liệu PDF:
q=Google+%2Dfiletype%3Apdf

Ví dụ này trả về tài liệu có nhắc đến "Google" nhưng không bao gồm cả tài liệu PDF và Word:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


Lọc loại tệp [ loại tệp: ]
Nội dung mô tả

Cụm từ truy vấn filetype: giới hạn kết quả tìm kiếm ở tài liệu có đuôi tệp cụ thể, chẳng hạn như ".pdf" hoặc ".doc". Truy vấn tìm kiếm phải được định dạng là filetype:EXTENSION với không có dấu cách giữa cụm từ truy vấn filetype: và cụm từ được chỉ định tiện ích.

Phiên bản thoát URL của filetype:filetype%3A.

Bạn có thể hạn chế tìm kiếm kết quả vào các tài liệu khớp với một trong các đuôi tệp bằng cách thêm nhiều cụm từ truy vấn filetype: hơn vào truy vấn của bạn. Bạn phải có một cụm từ truy vấn filetype: trong truy vấn tìm kiếm cho mỗi đuôi tệp mà bạn nên đưa vào kết quả tìm kiếm. Nhiều cụm từ truy vấn filetype: phải được phân tách bằng cụm từ truy vấn OR.

Theo mặc định, kết quả tìm kiếm sẽ bao gồm cả tài liệu có đuôi tệp bất kỳ.

Các loại tệp được Google hỗ trợ bao gồm:

  • Định dạng tài liệu di động Adobe (pdf)
  • Adobe PostScript (ps)
  • Sen 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Sen WordPro (lupp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản đa dạng thức (rtf)
  • Shockwave Flash (ưa thích )
  • Văn bản (ans, txt).

Sau này, chúng tôi có thể sẽ thêm các loại tệp khác. Trường hợp cập nhật luôn có thể tìm thấy trong phần Câu hỏi thường gặp về loại tệp của Google.

Ví dụ

Ví dụ này trả về tài liệu PDF có đề cập đến "Google":
q=Google+filetype%3Apdf

Ví dụ này trả về các tài liệu PDF và Word có đề cập đến "Google":
q=Google+filetype%3Apdf+OR+filetype%3Adoc


Bao gồm cụm từ truy vấn [+]
Nội dung mô tả

Cụm từ truy vấn bao gồm (+) chỉ định rằng một từ hoặc cụm từ phải có trong tất cả tài liệu có trong kết quả tìm kiếm. Để sử dụng bao gồm cụm từ truy vấn, bạn sẽ mở đầu từ hoặc cụm từ phải được bao gồm trong tất cả kết quả tìm kiếm bằng dấu "+" (dấu cộng).

Phiên bản thoát URL của + (dấu cộng) là %2B.

Bạn nên dùng + trước một từ thông dụng mà Google thường loại bỏ trước khi xác định kết quả tìm kiếm.

Ví dụ Dữ liệu do người dùng nhập: Star Wars Episode +I
Cụm từ truy vấn: q=Star+Wars+Episode+%2BI

Tìm kiếm chỉ liên kết, tất cả cụm từ [ allinlinks: ]
Nội dung mô tả

Cụm từ truy vấn allinlinks: yêu cầu tài liệu ở kết quả tìm kiếm chứa tất cả các từ của cụm từ tìm kiếm trong URL . Cụm từ tìm kiếm phải được định dạng là allinlinks:, theo sau là các từ trong cụm từ tìm kiếm.

Nếu cụm từ tìm kiếm của bạn có chứa cụm từ tìm kiếm allinlinks: thì Google sẽ chỉ kiểm tra các đường liên kết URL trong tài liệu để tìm những từ trong truy vấn tìm kiếm, bỏ qua văn bản khác trong tài liệu, tiêu đề tài liệu và URL của từng tài liệu. Xin lưu ý rằng giấy tờ URL khác với các đường liên kết URL có trong tài liệu.

Phiên bản thoát URL của allinlinks:allinlinks%3A.

Ví dụ Dữ liệu do người dùng nhập:allinlinks: Google search
Cụm từ truy vấn:q=allinlinks%3A+Google+search

Tìm kiếm theo cụm từ
Nội dung mô tả

Cụm từ tìm kiếm theo cụm từ (") cho phép bạn tìm kiếm cụm từ hoàn chỉnh bằng cách đặt cụm từ trong dấu ngoặc kép hoặc bằng cách kết nối chúng bằng dấu gạch nối.

Phiên bản thoát URL của " (dấu ngoặc kép) là %22.

Tìm kiếm theo cụm từ đặc biệt hữu ích nếu bạn đang tìm kiếm để có câu trích dẫn nổi tiếng hoặc cái tên thích hợp.

Bạn cũng có thể sử dụng yêu cầu as_epq để gửi tìm kiếm cụm từ.

Ví dụ Dữ liệu do người dùng nhập:"Abraham Lincoln"
Từ khoá truy vấn: q=%22Abraham+Lincoln%22

Tìm kiếm chỉ có văn bản, tất cả cụm từ [allintext:]
Nội dung mô tả

Cụm từ truy vấn allintext: yêu cầu mỗi tài liệu trong kết quả tìm kiếm để chứa tất cả các từ có trong cụm từ tìm kiếm phần nội dung của tài liệu. Truy vấn phải được định dạng là allintext: theo sau là các từ trong truy vấn tìm kiếm của bạn.

Nếu cụm từ tìm kiếm của bạn có chứa cụm từ tìm kiếm allintext: thì Google sẽ chỉ kiểm tra nội dung của tài liệu để tìm các từ trong truy vấn tìm kiếm, bỏ qua các liên kết trong các tài liệu đó, tài liệu tiêu đề và URL tài liệu.

Phiên bản thoát URL của allintext:allintext%3A.

Ví dụ Ví dụ này chỉ định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong phần nội dung của mọi tài liệu kèm theo trong kết quả tìm kiếm:
Dữ liệu do người dùng nhập:allintext:Google search
Cụm từ truy vấn:q=allintext%3AGoogle+search

Tìm kiếm tiêu đề, cụm từ duy nhất [intitle:]
Nội dung mô tả

Cụm từ truy vấn intitle: giới hạn kết quả tìm kiếm ở tài liệu có chứa một từ cụ thể trong tiêu đề tài liệu. Chiến lược phát hành đĩa đơn truy vấn tìm kiếm phải được định dạng là intitle:WORD và không có khoảng trắng giữa từ khoá truy vấn intitle: và từ sau.

Lưu ý: Bạn có thể chỉ định thêm một từ phải có trong tiêu đề tài liệu bằng cách đặt cụm từ truy vấn intitle: ở trước mỗi từ như vậy. Bạn có thể bạn cũng có thể sử dụng cụm từ truy vấn allintitle: để chỉ định rằng tất cả từ truy vấn phải được đưa vào tiêu đề của trong kết quả tìm kiếm.

Phiên bản thoát URL của intitle:intitle%3A.

Ví dụ

Ví dụ này chỉ rõ rằng từ "Google" phải xuất hiện trong tiêu đề của bất kỳ tài liệu nào trong kết quả tìm kiếm và từ "tìm kiếm" phải xuất hiện ở bất kỳ nơi nào trong tiêu đề, URL, đường liên kết hoặc nội dung trong số các tài liệu đó:
Dữ liệu do người dùng nhập:intitle:Google search
Cụm từ truy vấn:q=intitle%3AGoogle+search


Tìm kiếm tiêu đề, tất cả cụm từ [allintitle:]
Nội dung mô tả

Cụm từ truy vấn allintitle: giới hạn kết quả tìm kiếm ở tài liệu chứa tất cả từ truy vấn trong tiêu đề tài liệu. Người nhận hãy sử dụng cụm từ truy vấn allintitle:, bao gồm "allintitle:" ở đầu cụm từ tìm kiếm.

Lưu ý: Đặt allintitle: ở đầu một cụm từ tìm kiếm tương đương với việc đặt intitle: ở trước mỗi từ trong cụm từ tìm kiếm truy vấn.

Phiên bản thoát URL của allintitle:allintitle%3A.

Ví dụ

Ví dụ này chỉ định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong tiêu đề của mọi tài liệu trong kết quả tìm kiếm:
Dữ liệu do người dùng nhập: allintitle: Google search
Cụm từ truy vấn: q=allintitle%3A+Google+search


Tìm kiếm URL, cụm từ duy nhất [inurl:]
Nội dung mô tả

Cụm từ truy vấn inurl: giới hạn kết quả tìm kiếm ở các tài liệu có chứa một từ cụ thể trong URL tài liệu. Chiến lược phát hành đĩa đơn truy vấn tìm kiếm phải được định dạng là inurl:WORD không có khoảng trắng giữa từ khoá truy vấn inurl: và từ sau.

Truy vấn inurl: cụm từ này sẽ bỏ qua dấu câu và chỉ sử dụng từ đầu tiên đứng sau toán tử inurl:. Bạn có thể chỉ định nhiều từ phải được đưa vào trong URL tài liệu bằng cách đặt cụm từ truy vấn inurl: trước từng từ như vậy. Bạn cũng có thể sử dụng cụm từ truy vấn allinurl: để chỉ định rằng tất cả các từ truy vấn phải được bao gồm trong URL của tài liệu trong kết quả tìm kiếm.

Phiên bản thoát URL của inurl:inurl%3A.

Ví dụ

Ví dụ này chỉ rõ rằng từ "Google" phải xuất hiện trong URL của bất kỳ tài liệu nào trong kết quả tìm kiếm và từ "tìm kiếm" phải xuất hiện ở bất kỳ vị trí nào trong tiêu đề, URL, đường liên kết hoặc nội dung của những tài liệu:
Dữ liệu do người dùng nhập: inurl:Google search
Cụm từ truy vấn: q=inurl%3AGoogle+search


Tìm kiếm URL, tất cả cụm từ [allinurl:]
Nội dung mô tả

Cụm từ truy vấn allinurl: giới hạn kết quả tìm kiếm ở tài liệu chứa tất cả các từ truy vấn trong URL tài liệu. Người nhận hãy sử dụng cụm từ truy vấn allinurl:, đưa allinurl: vào đầu của cụm từ tìm kiếm.

Cụm từ truy vấn allinurl: bỏ qua dấu câu nên chỉ hoạt động trên các từ chứ không hoạt động trên URL thành phần. Ví dụ: allinurl: uk/scotland sẽ hạn chế kết quả vào tài liệu chứa từ "uk" và "scotland" trong URL của mình, nhưng sẽ không bắt buộc hai từ đó xuất hiện trong bất kỳ hoặc chúng được phân tách bằng dấu gạch chéo.

Phiên bản thoát URL của allinurl:allinurl%3A.

Ví dụ

Ví dụ này chỉ định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong URL của bất kỳ tài liệu nào trong kết quả tìm kiếm:
Dữ liệu do người dùng nhập: allinurl: Google search
Cụm từ truy vấn: q=allinurl%3A+Google+search



Thông tin tài liệu web [thông tin:]
Nội dung mô tả

Cụm từ truy vấn info: truy xuất thông tin chung về một URL miễn là URL đó có trong chỉ mục tìm kiếm của Google. Cụm từ tìm kiếm phải có định dạng là info:URL và không có khoảng trắng giữa cụm từ truy vấn info: và URL.

Phiên bản thoát URL của info:info%3A.

Lưu ý: Bạn không thể chỉ định bất kỳ cụm từ truy vấn nào khác khi đang sử dụng info:.

Ví dụ Dữ liệu do người dùng nhập: info:www.google.com
Từ khoá truy vấn: q=info%3Awww.google.com

Truy vấn hình ảnh mẫu

Ví dụ dưới đây minh hoạ một số yêu cầu HTTP dành cho hình ảnh để minh hoạ cách sử dụng các tham số truy vấn. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn hình ảnh của tài liệu này.

Yêu cầu này hỏi 5 kết quả đầu tiên (start=0&num=5) cho cụm từ truy vấn "khỉ" (q=monkey), thuộc loại tệp .png. Cuối cùng, truy vấn chỉ định giá trị cho các tham số client, outputcx. Cả ba tham số này đều bắt buộc.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Tham số truy vấn tìm kiếm hình ảnh

as_filetype
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh thuộc một loại đã chỉ định. Các giá trị được phép là: bmp, gif, png, jpgsvg.

Ví dụ q=google&as_filetype=png

imgsz
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh có kích thước đã chỉ định, trong đó kích thước có thể là một trong các kích thước sau:

  • icon (nhỏ)
  • small|medium|large|xlarge (trung bình)
  • xxlarge (lớn)
  • huge (cực lớn)

Ví dụ q=google&as_filetype=png&imgsz=icon

loại hình ảnh
Nội dung mô tả

Không bắt buộc. Trả về một kiểu hình ảnh, có thể là một trong các kiểu sau:

  • clipart (đoạn video)
  • face (khuôn mặt)
  • lineart (tuyến tính)
  • news (tin tức)
  • photo (ảnh)

Ví dụ q=google&as_filetype=png&imgtype=photo

imgc
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh đen trắng, thang màu xám hoặc màu:

  • mono (đen và trắng)
  • gray (thang màu xám)
  • color (màu)

Ví dụ q=google&as_filetype=png&imgc=gray

imgcolor
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh có một màu chủ đạo cụ thể:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
Ví dụ q=google&as_filetype=png&imgcolor=yellow

as_rights
Nội dung mô tả

Không bắt buộc. Bộ lọc dựa trên giấy phép. Sau đây là các giá trị được hỗ trợ:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

Ví dụ q=cats&as_filetype=png&as_rights=cc_attribute

Giới hạn yêu cầu

Biểu đồ bên dưới liệt kê các giới hạn về yêu cầu tìm kiếm mà bạn gửi đến Google:

Thành phần Hạn mức Bình luận
Độ dài yêu cầu tìm kiếm 2048 byte  
Số lượng cụm từ truy vấn 10 bao gồm các cụm từ trong những thông số sau: q, as_epq, as_eq, as_lq, as_oq, as_q
Số kết quả 20 Nếu bạn đặt tham số num thành một số lớn hơn 20, thì chỉ có 20 kết quả được trả về. Người nhận thu được nhiều kết quả hơn, bạn sẽ cần gửi nhiều yêu cầu và tăng giá trị của thông số start bằng từng yêu cầu.

Quốc tế hoá truy vấn và bản trình bày kết quả

Dịch vụ Google WebSearch cho phép bạn tìm kiếm tài liệu bằng nhiều ngôn ngữ. Bạn có thể chỉ định chế độ mã hoá ký tự được dùng để diễn giải yêu cầu HTTP và mã hoá phản hồi XML của bạn (bằng cách sử dụng tính năng tìm kiếm ieoe tham số). Bạn cũng có thể lọc kết quả để chỉ bao gồm tài liệu được viết bằng một số ngôn ngữ nhất định.

Các phần sau đây thảo luận về các vấn đề liên quan đến việc tìm kiếm trong nhiều ngôn ngữ:

Mã hoá ký tự

Máy chủ gửi dữ liệu (chẳng hạn như trang web) cho tác nhân người dùng, chẳng hạn như trình duyệt, dưới dạng một chuỗi các byte được mã hoá. Sau đó, tác nhân người dùng sẽ giải mã các byte thành một chuỗi ký tự. Khi gửi yêu cầu đến Dịch vụ WebSearch, bạn có thể chỉ định lược đồ mã hoá cho cả và cho phản hồi XML bạn nhận được.

Bạn có thể sử dụng tham số yêu cầu ie để chỉ định cơ chế mã hoá cho các ký tự trong yêu cầu HTTP của bạn. Bạn có thể bạn cũng có thể sử dụng tham số oe để chỉ định phương thức mã hoá mà Google nên sử dụng để mã hoá phản hồi XML của bạn. Nếu bạn bằng lược đồ mã hoá không phải là ISO-8859-1 (hoặc latin1), hãy đảm bảo rằng bạn chỉ định giá trị chính xác cho tham số ieoe.

Lưu ý:Nếu bạn đang cung cấp chức năng tìm kiếm cho nhiều ngôn ngữ, bạn nên sử dụng giá trị mã hoá utf8 (UTF-8) cho cả tham số ieoe.

Vui lòng tham khảo Ký tự Phần phụ lục Lược đồ mã hoá để biết danh sách đầy đủ các giá trị bạn có thể sử dụng cho tham số ieoe.

Để biết thêm thông tin chung về chế độ mã hoá ký tự, vui lòng xem tại http://www.w3.org/TR/REC-html40/charset.html.

Ngôn ngữ giao diện

Bạn có thể sử dụng tham số yêu cầu hl để xác định ngôn ngữ của giao diện đồ hoạ. Giá trị tham số hl có thể ảnh hưởng đến kết quả tìm kiếm XML, đặc biệt là trên truy vấn quốc tế khi giới hạn ngôn ngữ (sử dụng thông số lr) không được chỉ định rõ ràng. Trong phạm vi như vậy trường hợp, thông số hl có thể quảng bá kết quả tìm kiếm có cùng ngôn ngữ với ngôn ngữ nhập của người dùng.

Bạn nên đặt thông số hl một cách rõ ràng trong kết quả tìm kiếm để đảm bảo rằng Google chọn bài đăng có chất lượng cao nhất kết quả tìm kiếm cho từng cụm từ tìm kiếm.

Vui lòng xem Giao diện được hỗ trợ Ngôn ngữ để biết danh sách đầy đủ các giá trị hợp lệ cho thông số hl.

Tìm kiếm tài liệu được viết bằng ngôn ngữ cụ thể

Bạn có thể sử dụng thông số yêu cầu lr để hạn chế kết quả tìm kiếm đối với các tài liệu được viết bằng ngôn ngữ hoặc nhóm ngôn ngữ.

Tham số lr hỗ trợ Toán tử Boolean để cho phép bạn chỉ định nhiều ngôn ngữ cần được bao gồm (hoặc bị loại trừ) khỏi tìm kiếm kết quả.

Các ví dụ sau cho thấy cách bạn có thể sử dụng Toán tử Boolean để yêu cầu tài liệu trong ngôn ngữ khác nhau.

Đối với các tài liệu viết bằng tiếng Nhật:

lr=lang_jp

Đối với tài liệu được viết bằng tiếng Ý hoặc tiếng Đức:

lr=lang_it|lang_de

Đối với giấy tờ không được viết bằng tiếng Hungary hoặc tiếng Séc:

lr=(-lang_hu).(-lang_cs)

Vui lòng xem Bộ sưu tập ngôn ngữ Mục Giá trị để xem danh sách đầy đủ các giá trị có thể sử dụng cho thông số lrBoolean Phần Toán tử để thảo luận đầy đủ về việc sử dụng các toán tử này các toán tử.

Tiếng Trung giản thể và tiếng Trung phồn thể là hai biến thể chữ viết tiếng Trung. Cùng một khái niệm có thể được viết theo cách khác trong từng biến thể. Với truy vấn ở một trong các biến thể, phương thức Dịch vụ WebSearch có thể trả về kết quả chứa các trang ở cả hai các biến thể.

Để sử dụng tính năng này:

  1. Đặt tham số yêu cầu c2coff thành 0
  2. Làm một trong những việc sau:
    • Không đặt thông số yêu cầu lr
      hoặc
    • Đặt tham số yêu cầu lr thành lr=lang_zh-TW|lang_zh-CN

Ví dụ sau đây cho thấy các tham số truy vấn mà bạn sẽ đưa vào một yêu cầu kết quả bằng cả tiếng Trung giản thể và phồn thể. (Xin lưu ý rằng thông tin bắt buộc bổ sung, chẳng hạn như khách hàng không được đưa vào ví dụ.)

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

Lọc kết quả

Google WebSearch cung cấp một số cách để lọc kết quả tìm kiếm của bạn kết quả:

Tự động lọc kết quả tìm kiếm

Nhằm nỗ lực cung cấp kết quả tìm kiếm tốt nhất có thể, Google sử dụng hai kỹ thuật để tự động lọc kết quả tìm kiếm thường được coi là không mong muốn:

  • Nội dung trùng lặp—Nếu nhiều tài liệu chứa cùng thông tin, thì chỉ tài liệu có liên quan nhất trong tập hợp đó là có trong kết quả tìm kiếm của bạn.

  • Lọc kết quả tìm kiếm không mong muốn—Nếu có nhiều kết quả tìm kiếm từ cùng một trang web, Google có thể không hiển thị tất cả kết quả từ trang web đó hoặc có thể hiển thị các kết quả thấp hơn trong
    thứ hạng cao hơn so với dự kiến.

Bạn nên bật những bộ lọc này cho các yêu cầu tìm kiếm thông thường bởi vì các bộ lọc nâng cao đáng kể chất lượng của hầu hết các kết quả tìm kiếm kết quả. Tuy nhiên, bạn có thể bỏ qua các bộ lọc tự động này bằng cách đặt tham số truy vấn filter thành 0 trong yêu cầu tìm kiếm.

Lọc ngôn ngữ và quốc gia

Dịch vụ Google WebSearch trả về kết quả từ chỉ mục chính của tất cả tài liệu trên web. Chỉ mục chính chứa các tập hợp con của tài liệu được nhóm theo các thuộc tính cụ thể, bao gồm cả ngôn ngữ và quốc gia xuất xứ.

Bạn có thể sử dụng các thông số yêu cầu lrcr để giới hạn kết quả tìm kiếm ở các tập hợp con của tài liệu được viết bằng các ngôn ngữ cụ thể hoặc có nguồn gốc từ các quốc gia cụ thể, tương ứng.

Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • thẻ meta về ngôn ngữ trong tài liệu
  • ngôn ngữ chính được dùng trong nội dung của tài liệu


Vui lòng xem định nghĩa về thông số lr, phần trên Tìm kiếm Tài liệu được viết bằng các ngôn ngữ cụ thểGiá trị bộ sưu tập ngôn ngữ có thể được được dùng làm giá trị cho thông số lr để tìm hiểu thêm thông tin về việc hạn chế kết quả dựa trên ngôn ngữ.

Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • vị trí địa lý của địa chỉ IP của máy chủ Web

Vui lòng xem định nghĩa về thông số crTập hợp quốc gia Các giá trị có thể dùng làm giá trị cho thông số cr để biết thêm thông tin về việc hạn chế kết quả theo quốc gia của máy chủ gốc.

Lưu ý: Bạn có thể kết hợp ngôn ngữ và giá trị quốc gia để tuỳ chỉnh kết quả tìm kiếm của bạn. Cho Ví dụ: bạn có thể yêu cầu cung cấp tài liệu được viết bằng tiếng Pháp và đến từ Pháp hoặc Canada, hoặc bạn có thể yêu cầu giấy tờ đến từ Hà Lan và không được viết bằng tiếng Anh. Cả tham số lrcr đều hỗ trợ Toán tử Boolean.

Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn

Nhiều khách hàng của Google không muốn hiển thị kết quả tìm kiếm cho trang web có chứa nội dung người lớn. Khi sử dụng bộ lọc Tìm kiếm an toàn của chúng tôi, bạn có thể sàng lọc cho các kết quả tìm kiếm có chứa nội dung người lớn và loại bỏ chúng. Các bộ lọc của Google sử dụng công nghệ độc quyền để kiểm tra các từ khoá, cụm từ và URL. Mặc dù không có bộ lọc nào chính xác 100% nhưng tính năng Tìm kiếm an toàn sẽ xoá phần lớn nội dung người lớn khỏi nội dung tìm kiếm của bạn kết quả.

Google cố gắng duy trì tính cập nhật và toàn diện của tính năng Tìm kiếm an toàn bằng cách liên tục thu thập thông tin trên web và bằng cách kết hợp các bản cập nhật từ đề xuất của người dùng.

Tính năng Tìm kiếm an toàn hỗ trợ các ngôn ngữ sau:

Tiếng Hà Lan
Tiếng Anh
Tiếng Pháp
Tiếng Đức
Tiếng Ý
Tiếng Bồ Đào Nha (Brazil)
Tiếng Tây Ban Nha
Tiếng Trung phồn thể

Bạn có thể điều chỉnh mức độ mà Google lọc kết quả của bạn nội dung người lớn bằng cách sử dụng tham số truy vấn an toàn. Bảng sau đây giải thích các chế độ cài đặt tính năng Tìm kiếm an toàn của Google và cách những chế độ đó sẽ ảnh hưởng đến kết quả tìm kiếm của bạn:

Mức độ của tính năng Tìm kiếm an toàn Mô tả
cao Bật phiên bản nghiêm ngặt hơn tìm kiếm an toàn.
trung bình Chặn các trang web có chứa nội dung khiêu dâm và nội dung tình dục rõ ràng khác.
tắt Không lọc nội dung người lớn nội dung khỏi kết quả tìm kiếm.

* Chế độ Tìm kiếm an toàn mặc định là tắt.

Nếu bạn đã kích hoạt tính năng Tìm kiếm an toàn và thấy trang web có chứa nội dung phản cảm trong kết quả của bạn, vui lòng gửi email URL của trang web đến safesearch@google.com và chúng tôi sẽ điều tra trang web.

Kết quả XML

DTD Kết quả XML trên Google

Google sử dụng cùng một DTD để mô tả định dạng XML cho mọi loại kết quả tìm kiếm. Nhiều thẻ và thuộc tính có thể áp dụng cho tất cả loại tìm kiếm. Tuy nhiên, một số thẻ chỉ có thể áp dụng cho một số loại tìm kiếm. Do đó, các định nghĩa trong DTD có thể ít hạn chế hơn so với các định nghĩa được cung cấp trong tài liệu này.

Tài liệu này mô tả những khía cạnh có liên quan của DTD cho WebSearch. Khi bạn xem xét DTD, nếu bạn đang làm việc trên WebSearch, bạn có thể yên tâm bỏ qua các thẻ và thuộc tính không được ghi lại tại đây. Nếu định nghĩa khác nhau giữa DTD và tài liệu chứng minh, rằng thực tế đó được ghi chú trong tài liệu này.

Google có thể trả về các kết quả XML có hoặc không có tham chiếu đến DTD gần đây nhất. DTD là một hướng dẫn để giúp các quản trị viên tìm kiếm và trình phân tích cú pháp XML hiểu được kết quả XML của Google. Bởi vì XML của Google ngữ pháp có thể thay đổi tuỳ từng thời điểm, bạn không nên định cấu hình trình phân tích cú pháp để sử dụng DTD nhằm xác thực từng kết quả XML.

Ngoài ra, bạn không nên định cấu hình trình phân tích cú pháp XML để tìm nạp DTD mỗi lần bạn gửi yêu cầu tìm kiếm. Google cập nhật DTD và những yêu cầu này tạo ra độ trễ cũng như băng thông không cần thiết các yêu cầu liên quan.

Bạn nên sử dụng định dạng đầu ra xml_no_dtd để nhận kết quả XML. Nếu bạn chỉ định định dạng xml output trong yêu cầu tìm kiếm của mình, điểm khác biệt duy nhất là việc thêm dòng sau vào kết quả XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

Bạn có thể truy cập vào DTD mới nhất tại http://www.google.com/google.dtd.

Xin lưu ý rằng một số tính năng trong DTD có thể không có sẵn hoặc được hỗ trợ tại thời điểm này.

Giới thiệu về Phản hồi XML

  • Tất cả các giá trị của phần tử đều là HTML hợp lệ, phù hợp để hiển thị, trừ trường hợp được ghi chú khác trong định nghĩa thẻ XML.
  • Một số giá trị phần tử là URL cần được mã hoá HTML trước chúng sẽ được hiển thị.
  • Trình phân tích cú pháp XML của bạn phải bỏ qua các thuộc tính và thẻ không được ghi nhận. Lựa chọn này cho phép ứng dụng tiếp tục hoạt động mà không cần sửa đổi nếu Google thêm các tính năng khác vào đầu ra XML.
  • Một số ký tự nhất định phải được thoát khi được đưa vào dưới dạng giá trị trong Thẻ XML. Bộ xử lý XML của bạn nên chuyển đổi những thực thể này trở lại thành các ký tự thích hợp. Nếu bạn không chuyển đổi đối tượng đúng cách, trình duyệt có thể hiển thị & ký tự "&amp;". Tệp XML Tiêu chuẩn ghi nhận các ký tự này; những nhân vật này được tái tạo trong bảng dưới đây:

    Ký tự Biểu mẫu thoát Thực thể Mã ký tự
    Ký hiệu & & &amp; &#38;
    Dấu nháy đơn ' &apos; &#39;
    Dấu nháy kép " &quot; &#34;
    Dấu lớn hơn > &gt; &#62;
    Dấu nhỏ hơn < &lt; &#60;

Kết quả XML cho truy vấn tìm kiếm thông thường và nâng cao

Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML

Yêu cầu WebSearch mẫu này cần 10 kết quả (num=10) về cụm từ tìm kiếm "socer" (q=socer), đó là từ "bóng đá" cố ý viết sai chính tả cho ví dụ này.)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

Yêu cầu này tạo ra kết quả XML dưới đây. Xin lưu ý rằng có một số nhận xét trong kết quả XML để cho biết vị trí mà một số thẻ nhất định không có trong kết quả sẽ xuất hiện.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

Tìm kiếm thông thường/nâng cao: Thẻ XML

Phản hồi XML cho các yêu cầu tìm kiếm thông thường và tìm kiếm nâng cao cả hai yêu cầu đều sử dụng cùng một bộ thẻ XML. Những thẻ XML này được hiển thị trong ví dụ XML ở trên và được giải thích trong bảng bên dưới.

Các thẻ XML dưới đây được liệt kê theo thứ tự bảng chữ cái của tên thẻ và mỗi thẻ định nghĩa thẻ chứa mô tả về thẻ, ví dụ cho thấy cách thẻ xuất hiện trong kết quả XML và định dạng của thẻ nội dung. Nếu thẻ là thẻ phụ của một thẻ XML khác hoặc nếu thẻ có các thẻ phụ hoặc thuộc tính của riêng mình, thông tin đó cũng được cung cấp trong bảng định nghĩa của thẻ.

Một số biểu tượng nhất định có thể được hiển thị bên cạnh một số thẻ phụ trong định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:

không? = thẻ phụ không bắt buộc
* = không có hoặc có nhiều lần xuất hiện của thẻ phụ
+ = một hoặc nhiều lần xuất hiện của thẻ phụ
A B D Khắc phục G T N N M B Bàn thắng Hỏi R N T U X

anchor_text
Định nghĩa

Thẻ &lt;anchor_text&gt; chỉ định văn bản bạn nên hiển thị cho người dùng để xác định bản tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm. Vì nhãn tinh lọc thay thế ký tự không phải chữ và số bằng dấu gạch dưới, thì bạn không nên hiển thị giá trị của thẻ <label> trong giao diện người dùng của bạn. Thay vào đó, bạn nên hiển thị giá trị của thẻ &lt;anchor_text&gt;.

Ví dụ <anchor_text>gôn khoá học</anchor_text>
Thẻ phụ của FacetItem
Định dạng nội dung Văn bản

CHẶN
Định nghĩa

Thẻ này đóng gói nội dung của một khối trong dòng nội dung của kết quả khuyến mãi. Mỗi khối có các thẻ phụ T, UL. Thẻ T không trống biểu thị rằng khối chứa văn bản; các thẻ UL không trống cho biết khối này chứa một đường liên kết (với URL được cung cấp trong thẻ phụ U và văn bản liên kết trong thẻ phụ L).

Thẻ phụ T, U, L
Thẻ phụ của BODY_LINE
Định dạng nội dung Trống

BODY_LINE
Định nghĩa

Thẻ này đóng gói nội dung của một dòng trong phần nội dung của kết quả được quảng bá. Mỗi dòng nội dung bao gồm một số thẻ CHẶN, trong đó chứa một số văn bản hoặc một đường liên kết có URL và văn bản liên kết.

Thẻ phụ CHẶN*
Thẻ phụ của SL_MAIN
Định dạng nội dung Trống

C
Định nghĩa

Thẻ &lt;C&gt; cho biết rằng dịch vụ WebSearch có thể truy xuất phiên bản đã lưu trong bộ nhớ đệm của URL kết quả tìm kiếm này. Bạn không thể truy xuất các trang đã lưu vào bộ nhớ đệm thông qua XML API, nhưng bạn có thể chuyển hướng người dùng vào www.google.com để thực hiện việc này nội dung.

Thuộc tính
Tên Định dạng Mô tả
Bosnia và Herzegovina (SZ) Văn bản (Số nguyên + "k") Cung cấp kích thước của phiên bản đã lưu vào bộ nhớ đệm của kết quả tìm kiếm tính bằng kilobyte ("k").
Mã khách hàng Văn bản Xác định một tài liệu trong bộ nhớ đệm của Google. Để tìm nạp tài liệu từ bộ nhớ đệm, hãy gửi cụm từ tìm kiếm được tạo dưới dạng sau:
cache:CIDtext:escapedURL

URL thoát có trong thẻ UE.

Ví dụ <C SZ="6 nghìn" CID=&quot;kvOXK_cYSSgJ&quot; >
Thẻ phụ của
Định dạng nội dung Trống

C2C (C2C)
Định nghĩa Thẻ <C2C> cho biết rằng kết quả đề cập đến một trang tiếng Trung phồn thể. Thẻ này chỉ xuất hiện khi Giản thể và Truyền thống Tính năng Tìm kiếm bằng tiếng Trung đã bật. Xem định nghĩa tham số truy vấn c2coff để biết thêm thông tin về cách bật và tắt tính năng này.
Định dạng nội dung Văn bản

Bối cảnh
Định nghĩa

Thẻ &lt;Context&gt; bao gồm danh sách các nhãn sàng lọc được liên kết với một nhóm kết quả tìm kiếm.

Ví dụ &lt;Context&gt;
Thẻ phụ tiêu đề, Khía cạnh+
Định dạng nội dung Vùng chứa

Hàm CRAWLDATE
Định nghĩa

Thẻ &lt;CRAWLDATE&gt; xác định ngày mà được thu thập dữ liệu lần cuối. Không phải trang kết quả tìm kiếm nào cũng trả về CRAWLDATE.

Ví dụ <CRAWLDATE>Ngày 21 tháng 5 năm 2005</CRAWLDATE>
Thẻ phụ của R
Định dạng nội dung Văn bản

Số lượt chuyển đổi (DI)
Định nghĩa

Thẻ &lt;DI&gt; đóng gói Dự án thư mục mở (ODP) cho một kết quả tìm kiếm.

Ví dụ &lt;DI&gt;
Thẻ phụ DT?, DS?
Thẻ phụ của
Định dạng nội dung Trống

DS
Định nghĩa

Thẻ &lt;DS&gt; cung cấp thông tin tóm tắt được liệt kê cho một danh mục trong thư mục ODP.

Ví dụ <DS>Đăng &lt;b&gt;bóng đá&lt;/b&gt; tiếp tục ngay trên Internet.</DS>
Thẻ phụ của Hàm DI
Định dạng nội dung Văn bản (có thể chứa HTML)

DT (cây thiết bị)
Định nghĩa

Thẻ &lt;DT&gt; cung cấp tiêu đề cho một danh mục được liệt kê trong thư mục ODP.

Ví dụ &lt;DT&gt;SoccerConnection.net&lt;/DT&gt;
Thẻ phụ của Hàm DI
Định dạng nội dung Văn bản (có thể chứa HTML)

Thuộc tính
Định nghĩa

Thẻ <Facet> chứa một nhóm logic gồm các thẻ &lt;FacetItem&gt;. Bạn có thể tạo bằng cách sử dụng Công cụ tìm kiếm có thể lập trình Định dạng thông số kỹ thuật XML của công cụ. Nếu bạn không tạo các tài sản này nhóm, kết quả_xml_tag_Context><Context> thẻ sẽ chứa có 4 thẻ <Facet>. Các mục trong mỗi thẻ <Facet> sẽ được nhóm lại để hiển thị nhưng có thể không có logic mối quan hệ.

Ví dụ <Khía cạnh>
Thẻ phụ FacetItem+, title+
Thẻ phụ của Bối cảnh
Định dạng nội dung Vùng chứa

FacetItem
Định nghĩa

Thẻ &lt;FacetItem&gt; đóng gói thông tin về một nhãn tinh lọc được liên kết với một nhóm kết quả tìm kiếm.

Ví dụ &lt;FacetItem&gt;
Thẻ phụ nhãn, anchor_text+
Thẻ phụ của Khía cạnh
Định dạng nội dung FacetItem

FI
Định nghĩa Thẻ &lt;FI&gt; đóng vai trò là cờ cho biết liệu quá trình lọc tài liệu có được thực hiện cho việc tìm kiếm hay không. Xem phần Lọc tự động của tài liệu này để biết thêm thông tin về kết quả tìm kiếm của Google bộ lọc.
Ví dụ <FI />
Thẻ phụ của RES
Định dạng nội dung Trống

GSP
Định nghĩa

Thẻ &lt;GSP&gt; đóng gói tất cả dữ liệu được trả về trong kết quả tìm kiếm XML của Google. "GSP" là chữ viết tắt của "Giao thức Tìm kiếm của Google".

Thuộc tính
Tên Định dạng Mô tả
THAY ĐỔI Văn bản (Số nguyên) Thuộc tính VER chỉ định phiên bản của kết quả tìm kiếm đầu ra. Chiến lược phát hành đĩa đơn phiên bản đầu ra hiện tại là "3.2".
Ví dụ <GSP VER="3.2">
Thẻ phụ PARAM+, Q, RES?, TM
Định dạng nội dung Trống

Định nghĩa Thẻ &lt;HAS&gt; đóng gói thông tin về tìm kiếm đặc biệt bất kỳ tham số yêu cầu được hỗ trợ cho một URL cụ thể.

Lưu ý: Định nghĩa của <HAS> cho WebSearch hạn chế hơn so với trong DTD.

Thẻ phụ DI?, B?, C?, RT?
Thẻ phụ của R

ISURL
Định nghĩa Google trả về thẻ &lt;ISURL&gt; nếu cụm từ tìm kiếm được liên kết là một URL.
Thẻ phụ của GSP
Định dạng nội dung Trống

L
Định nghĩa Sự hiện diện của thẻ &lt;L&gt; cho biết dịch vụ WebSearch có thể tìm thấy các trang web khác liên kết tới URL của kết quả tìm kiếm này. Để tìm những trang web như vậy, bạn cần dùng cụm từ truy vấn đặc biệt link:.
Thẻ phụ của
Định dạng nội dung Trống

nhãn
Định nghĩa

Thẻ <label> chỉ định nhãn tinh lọc mà bạn có thể sử dụng để lọc kết quả tìm kiếm bạn nhận được. Để sử dụng nhãn tinh lọc, thêm chuỗi more:[[label tag value]] vào giá trị của tham số q trong yêu cầu HTTP của bạn tới Google dưới dạng như trong ví dụ sau. Xin lưu ý rằng giá trị này phải Có mã thoát URL trước khi gửi truy vấn tới Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

Lưu ý: Thẻ <label> không giống với thẻ &lt;Label&gt;, xác định nhãn tinh lọc được liên kết với một URL cụ thể trong kết quả tìm kiếm.

Ví dụ &lt;label&gt;golf_courses&lt;/label&gt;
Thẻ phụ của FacetItem
Định dạng nội dung Văn bản

LANG
Định nghĩa

Thẻ &lt;LANG&gt; chứa gợi ý tốt nhất của Google về ngôn ngữ của kết quả tìm kiếm.

Ví dụ <language>vi</b>
Thẻ phụ của R
Định dạng nội dung Văn bản

M
Định nghĩa

Thẻ &lt;M&gt; xác định tổng số ước tính số lượng kết quả cho tìm kiếm.

Lưu ý: Số liệu ước tính này có thể không chính xác.

Ví dụ <M>16200000</M>
Thẻ phụ của RES
Định dạng nội dung Văn bản

Sơ sinh
Định nghĩa

Thẻ &lt;NB&gt; bao gồm thông tin điều hướng—liên kết đến trang tiếp theo của kết quả tìm kiếm hoặc trang trước của kết quả tìm kiếm — cho nhóm kết quả.

Lưu ý: Thẻ này chỉ tồn tại nếu có thêm kết quả.

Ví dụ &lt;NB&gt;
Thẻ phụ NU?, PU?
Thẻ phụ của RES
Định dạng nội dung Trống

NU
Định nghĩa

Thẻ &lt;NU&gt; chứa một liên kết tương đối đến trang tiếp theo của kết quả tìm kiếm.

Ví dụ <NU>/search?q=flowers&num=10&hl=vi&ie=UTF-8
&output=xml&client=test&start=10</NU>
Thẻ phụ của Lưu ý
Định dạng nội dung Văn bản (URL tương đối)

THÔNG TIN
Định nghĩa

Thẻ &lt;PARAM&gt; xác định một tham số đầu vào được gửi trong yêu cầu HTTP được liên kết với kết quả XML. Thông tin về tham số này có trong các thuộc tính thẻ—tên, giá trị, giá trị gốc—và sẽ có một thẻ PARAM cho mỗi tham số được gửi trong yêu cầu HTTP.

Thuộc tính
Tên Định dạng Mô tả
name Văn bản Tên tham số đầu vào.
value HTML Phiên bản định dạng HTML của thông tin đầu vào giá trị tham số.
original_value Văn bản Phiên bản thoát URL gốc của giá trị thông số đầu vào.
Ví dụ <PARAM name="cr" value=&quot;countryNZ&quot; Original_value="countryNZ" >
Thẻ phụ của GSP
Định dạng nội dung Phức tạp

PU
Định nghĩa

Thẻ &lt;PU&gt; cung cấp một liên kết tương đối đến trang trước của kết quả tìm kiếm.

Ví dụ <PU>/search?q=hoa&num=10&hl=vi&output=xml
&client=test&start=10</PU>
Thẻ phụ của Lưu ý
Định dạng nội dung Văn bản (URL tương đối)

Hỏi
Định nghĩa

Thẻ &lt;Q&gt; xác định truy vấn tìm kiếm được gửi trong yêu cầu HTTP liên quan đến kết quả XML.

Ví dụ

<Q>pizza</Q>

Thẻ phụ của GSP
Định dạng nội dung Văn bản

Điểm
Định nghĩa

Thẻ &lt;R&gt; đóng gói chi tiết của kết quả tìm kiếm riêng lẻ.

Lưu ý: Định nghĩa của thẻ <R> cho WebSearch hạn chế hơn so với trong DTD.

Thuộc tính
Tên Định dạng Mô tả
Không Văn bản (Số nguyên) Cho biết chỉ số (dựa trên 1) của giá trị này kết quả tìm kiếm.
MIME Văn bản Cho biết loại MIME của tìm kiếm kết quả.
Thẻ phụ U, UE, T?, CRAWLDATE, N?, LANG?,
Thẻ phụ của RES

RES
Định nghĩa

Thẻ &lt;RES&gt; bao gồm tập hợp từng cá nhân kết quả tìm kiếm và thông tin chi tiết về những kết quả đó.

Thuộc tính
Tên Định dạng Mô tả
SN (Senegal) Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm đầu tiên được trả về trong nhóm kết quả này.
VI Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm được trả về trong nhóm kết quả này.
Ví dụ <RES SN="1" EN="10">
Thẻ phụ M, FI?, XT?, NB?, Đ*
Thẻ phụ của GSP
Định dạng nội dung Trống

CN
Định nghĩa

Thẻ &lt;S&gt; chứa phần trích dẫn cho một tìm kiếm kết quả cho thấy các cụm từ truy vấn được in đậm. Ngắt dòng là được bao gồm trong phần trích dẫn để xuống dòng tự động.

Ví dụ <S>Washington (CNN) -- Giá thầu để chấm dứt Tranh chấp tại Thượng viện về việc Tổng thống &lt;b&gt;Bush&#39;s&lt;/b&gt; lựa chọn của thẩm phán sẽ để 5 người được đề cử tiến đến cuộc bỏ phiếu cuối cùng trong khi vẫn giữ nguyên &lt;b&gt;...&lt;b&gt;...&lt;/b&gt;<S>
Thẻ phụ của R
Định dạng nội dung Văn bản (HTML)

SL_MAIN
Định nghĩa

Thẻ này bao gồm nội dung của kết quả khuyến mãi. Dùng để phân tích cú pháp chương trình khuyến mãi. Văn bản liên kết và URL của đường liên kết tiêu đề lần lượt có trong các thẻ phụ TU. Các dòng văn bản nội dung và đường liên kết nằm trong thẻ phụ BODY_LINE.

Thẻ phụ BODY_LINE*, T, U
Thẻ phụ của SL_RESULTS
Định dạng nội dung Trống

SL_RESULTS
Định nghĩa

Thẻ vùng chứa cho kết quả được quảng bá. Một trong những thông báo này sẽ xuất hiện bất cứ khi nào bạn có chương trình khuyến mãi trong kết quả tìm kiếm. Thẻ phụ SL_MAIN chứa dữ liệu kết quả chính.

Thẻ phụ SL_MAIN*
Thẻ phụ của R
Định dạng nội dung Trống

Chính tả
Định nghĩa

Thẻ <Maining> đóng gói một nội dung thay thế gợi ý chính tả cho truy vấn đã gửi. Thẻ này chỉ xuất hiện trên trang đầu tiên của kết quả tìm kiếm. Có đề xuất chính tả bằng Tiếng Anh, tiếng Trung, tiếng Nhật và tiếng Hàn.

Lưu ý: Google sẽ chỉ trả về các mục đề xuất chính tả cho các truy vấn có giá trị thông số gl chữ thường.

Ví dụ <Chính tả>
Thẻ phụ Đề xuất
Thẻ phụ của GSP
Định dạng nội dung Trống

Đề xuất
Định nghĩa Thẻ &lt;Suggestion&gt; chứa gợi ý chính tả thay thế cho truy vấn đã gửi. Bạn có thể sử dụng nội dung của thẻ để đề xuất cách viết thay thế cho người dùng tìm kiếm của bạn. Giá trị của thuộc tính q là Đề xuất chính tả thoát URL mà bạn có thể sử dụng làm cụm từ truy vấn.
Thuộc tính
Tên Định dạng Nội dung mô tả
q Văn bản Thuộc tính q chỉ định Phiên bản thoát URL của đề xuất chính tả.
Ví dụ <Đề xuất q=&quot;soccer&quot;&gt;&amp;lt;b&amp;gt;&amp;lt;i&amp;gt;soccer&amp;lt;/i&amp;gt;&amp;lt;/b&amp;gt;&lt;/Suggestion&gt;
Thẻ phụ của Chính tả
Định dạng nội dung Văn bản (HTML)

T
Định nghĩa Thẻ &lt;T&gt; chứa tiêu đề kết quả.
Ví dụ <T>Bờ Đông của Amici Nhà hàng pizza</T>
Thẻ phụ của R
Định dạng nội dung Văn bản (HTML)

tiêu đề
Định nghĩa

Là phần tử con của &lt;Context&gt;, thẻ &lt;Context&gt; chứa tên của Công cụ tìm kiếm có thể lập trình.

Là phần tử con của <Facet>, thẻ <title> cung cấp tiêu đề cho một tập hợp các thuộc tính.

Ví dụ

Là con của <Context>: <title>Tìm kiếm của tôi Engine&lt;/title&gt;

Là con của <Facet>: <title>facet tiêu đề</title>

Thẻ phụ của Ngữ cảnh, Khía cạnh
Định dạng nội dung Văn bản

TM
Định nghĩa

Thẻ &lt;TM&gt; xác định tổng thời gian máy chủ cần thiết để trả về kết quả tìm kiếm (tính bằng giây).

Ví dụ <TM>0.100445</TM>
Thẻ phụ của GSP
Định dạng nội dung Văn bản (Số dấu phẩy động)

TT
Định nghĩa Thẻ &lt;TT&gt; cung cấp tính năng tìm kiếm đầu.
Ví dụ <TT>&lt;i&gt;Mẹo: Đối với hầu hết của trình duyệt, nhấn phím Return sẽ tạo ra kết quả tương tự như nhấp vào nút Tìm kiếm.&lt;/i&gt;</TT>
Thẻ phụ của GSP

U
Định nghĩa Thẻ &lt;U&gt; cung cấp URL của kết quả tìm kiếm.
Ví dụ &lt;U&gt;http://www.dominos.com/&lt;/U&gt;
Thẻ phụ của R
Định dạng nội dung Văn bản (URL tuyệt đối)

UD
Định nghĩa

Thẻ &lt;UD&gt; cung cấp mã nhận dạng IDN (Tên miền quốc tế) cho kết quả tìm kiếm. Giá trị cho phép tên miền được hiển thị bằng ngôn ngữ địa phương. Ví dụ: URL được mã hoá bằng IDN http://www.%E8%8A%B1%E4%BA%95.com có thể được giải mã và hiển thị dưới dạng http://www.花Chào鮨.com. Thẻ &lt;UD&gt; này sẽ chỉ được đưa vào kết quả tìm kiếm cho các yêu cầu bao gồm thông số ud.

Lưu ý: Đây là tính năng thử nghiệm.

Ví dụ &lt;UD&gt;http://www.%E8%8A%B1%E4%BA%95.com/&lt;/UD&gt;
Thẻ phụ của R
Định dạng nội dung Văn bản (URL được mã hoá IDN)

UE
Định nghĩa Thẻ &lt;UE&gt; cung cấp URL của kết quả tìm kiếm. Giá trị được thoát URL để phù hợp để chuyển dưới dạng tham số truy vấn trong URL.
Ví dụ &lt;UE&gt;http://www.dominos.com/&lt;/UE&gt;
Thẻ phụ của R
Định dạng nội dung Văn bản (URL thoát URL)

XT
Định nghĩa Thẻ &lt;XT&gt; cho biết rằng tổng số kết quả ước tính, như được chỉ định bởi thẻ M, thực sự thể hiện đúng tổng số kết quả. Xem cột Tự động Lọc của tài liệu này để biết thêm thông tin chi tiết.
Ví dụ <XT />
Thẻ phụ của RES
Định dạng nội dung Trống


Kết quả XML cho truy vấn tìm kiếm hình ảnh

Yêu cầu Hình ảnh mẫu này cần 5 kết quả (num=5) về cụm từ tìm kiếm "khỉ" (q=khỉ).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Yêu cầu này tạo ra kết quả XML dưới đây.


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

Tìm kiếm hình ảnh: Thẻ XML

Bảng dưới đây trình bày các thẻ XML bổ sung được sử dụng trong phản hồi XML cho các truy vấn tìm kiếm hình ảnh.

Một số biểu tượng nhất định có thể được hiển thị bên cạnh một số thẻ phụ trong định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:

không? = thẻ phụ không bắt buộc
* = không có hoặc có nhiều lần xuất hiện của thẻ phụ
+ = một hoặc nhiều lần xuất hiện của thẻ phụ

RG
Định nghĩa

Thẻ &lt;RG&gt; chứa thông tin chi tiết của một kết quả tìm kiếm hình ảnh riêng lẻ.

Thuộc tính
Tên Định dạng Mô tả
Không Văn bản (Số nguyên) Cho biết chỉ số (dựa trên 1) của giá trị này kết quả tìm kiếm.
MIME Văn bản Cho biết loại MIME của tìm kiếm kết quả.
Thẻ phụ của RES
RU (Nga)
Định nghĩa

Thẻ <RU tag> chứa thông tin chi tiết của từng kết quả tìm kiếm hình ảnh.

Thẻ phụ của R