Tài liệu tham khảo API XML

Trang này đề cập đến phiên bản XML của Custom Search JSON API. Phiên bản này chỉ dành cho khách hàng sử dụng Tìm kiếm trên trang web của Google.

  1. Tổng quan
  2. Định dạng yêu cầu của Công cụ tìm kiếm có thể lập trình
    1. Tổng quan về yêu cầu
    2. Cụm từ tìm kiếm
    3. Tham số của yêu cầu
      1. Truy vấn mẫu cho WebSearch
      2. Định nghĩa về tham số truy vấn WebSearch
      3. Tìm kiếm nâng cao
      4. Tham số truy vấn tìm kiếm nâng cao
      5. Điều khoản đặc biệt về cụm từ tìm kiếm
      6. Cụm từ tìm kiếm hình ảnh mẫu
      7. Tham số truy vấn tìm kiếm hình ảnh
      8. Giới hạn yêu cầu
    4. Quốc tế hoá cụm từ tìm kiếm và cách trình bày kết quả
      1. Mã hoá ký tự
      2. Ngôn ngữ giao diện
      3. Tìm kiếm bằng tiếng Trung giản thể và tiếng Trung phồn thể
    5. Lọc kết quả
      1. Tự động lọc kết quả tìm kiếm
      2. Lọc theo ngôn ngữ và quốc gia
      3. Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
  3. Kết quả XML
    1. DTD kết quả XML của Google
    2. Giới thiệu về phản hồi XML
    3. Kết quả XML cho các cụm từ tìm kiếm thông thường, hình ảnh và nâng cao
      1. Tìm kiếm thông thường/nâng cao: Cụm từ tìm kiếm mẫu và kết quả XML
      2. Tìm kiếm thông thường/nâng cao: Thẻ XML
      3. Kết quả XML cho các cụm từ tìm kiếm hình ảnh
      4. Tìm kiếm hình ảnh: Truy vấn mẫu và kết quả XML
      5. Tìm kiếm hình ảnh: Thẻ XML

Tổng quan

Dịch vụ Google WebSearch cho phép khách hàng của Google Site Search hiển thị kết quả tìm kiếm trên Google trên trang web của riêng họ. Dịch vụ WebSearch sử dụng một giao thức đơn giản dựa trên HTTP để phân phát kết quả tìm kiếm. Quản trị viên tìm kiếm có toàn quyền kiểm soát cách họ yêu cầu kết quả tìm kiếm và cách họ trình bày những kết quả đó cho người dùng cuối. Tài liệu này mô tả chi tiết về kỹ thuật của định dạng yêu cầu và kết quả tìm kiếm của Google.

Để truy xuất kết quả từ Google Tìm kiếm trên web, ứng dụng của bạn sẽ gửi cho Google một yêu cầu HTTP đơn giản. Sau đó, Google sẽ trả về kết quả tìm kiếm ở định dạng XML. Kết quả được định dạng XML cho phép bạn tuỳ chỉnh cách kết quả tìm kiếm hiển thị.

Định dạng yêu cầu WebSearch

Tổng quan về yêu cầu

Yêu cầu tìm kiếm của Google là một lệnh HTTP GET tiêu chuẩn. Nó bao gồm một tập hợp các tham số liên quan đến truy vấn của bạn. Các tham số này được đưa vào URL yêu cầu dưới dạng các cặp name=value được phân tách bằng ký tự dấu và (&). Các tham số bao gồm dữ liệu như cụm từ tìm kiếm và mã nhận dạng riêng biệt của công cụ (cx) để xác định công cụ đang đưa ra yêu cầu HTTP. Dịch vụ WebSearch hoặc Tìm kiếm hình ảnh trả về kết quả XML để phản hồi các yêu cầu HTTP của bạn.

Cụm từ tìm kiếm

Hầu hết các yêu cầu tìm kiếm đều có một hoặc nhiều cụm từ tìm kiếm. Cụm từ tìm kiếm xuất hiện dưới dạng giá trị của một tham số trong yêu cầu tìm kiếm.

Cụm từ tìm kiếm có thể chỉ định một số loại thông tin để lọc và sắp xếp kết quả tìm kiếm mà Google trả về. Cụm từ tìm kiếm có thể chỉ định:

  • Từ hoặc cụm từ cần thêm hoặc loại trừ
    • Tất cả các từ trong cụm từ tìm kiếm (mặc định)
    • Một cụm từ chính xác trong cụm từ tìm kiếm
    • Bất kỳ từ hoặc cụm từ nào trong cụm từ tìm kiếm
  • Vị trí trong tài liệu để tìm cụm từ tìm kiếm
    • Mọi nơi trong tài liệu (mặc định)
    • Chỉ trong các đường liên kết trong tài liệu
  • Các quy định hạn chế đối với chính tài liệu
    • Bao gồm hoặc loại trừ tài liệu thuộc một số loại tệp cụ thể (chẳng hạn như tệp PDF hoặc tài liệu Word)
  • Cụm từ tìm kiếm đặc biệt trong URL trả về thông tin về một URL nhất định, thay vì thực hiện một cụm từ tìm kiếm
    • Các truy vấn trả về thông tin chung về một URL, chẳng hạn như danh mục, đoạn trích hoặc ngôn ngữ của URL đó trên Open Directory
    • Các truy vấn trả về tập hợp các trang web liên kết đến một URL
    • Các truy vấn trả về một tập hợp các trang web tương tự như một URL nhất định

Tìm kiếm mặc định

Giá trị tham số truy vấn tìm kiếm phải được thoát URL. Xin lưu ý rằng bạn sẽ thay thế dấu cộng ("+") cho mọi chuỗi khoảng trắng trong cụm từ tìm kiếm. Vấn đề này sẽ được thảo luận thêm trong phần Thoát URL của tài liệu này.

Cụm từ tìm kiếm được gửi đến dịch vụ WebSearch bằng tham số q. Một cụm từ tìm kiếm mẫu là:

q=horses+cows+pigs

Theo mặc định, dịch vụ Google WebSearch chỉ trả về những tài liệu có chứa tất cả các cụm từ trong cụm từ tìm kiếm.

Tham số yêu cầu

Phần này liệt kê các tham số mà bạn có thể sử dụng khi đưa ra yêu cầu tìm kiếm. Các tham số được chia thành hai danh sách. Danh sách đầu tiên chứa các tham số liên quan đến tất cả các yêu cầu tìm kiếm. Danh sách thứ hai chứa các tham số chỉ liên quan đến yêu cầu tìm kiếm nâng cao.

Bạn phải có 3 tham số yêu cầu:

  • Bạn phải đặt tham số client thành google-csbe
  • Tham số output chỉ định định dạng của kết quả XML được trả về; kết quả có thể được trả về có (xml) hoặc không có (xml_no_dtd) nội dung tham chiếu đến DTD của Google. Bạn nên đặt giá trị này thành xml_no_dtd. Lưu ý: Nếu bạn không chỉ định tham số này, thì kết quả sẽ được trả về ở định dạng HTML thay vì XML.
  • Tham số cx đại diện cho mã nhận dạng duy nhất của công cụ.

Các tham số yêu cầu thường dùng nhất ngoài những tham số đã đề cập ở trên là:

  • num – số lượng kết quả tìm kiếm được yêu cầu
  • q – (các) cụm từ tìm kiếm
  • start – chỉ mục bắt đầu cho kết quả

Truy vấn mẫu trên WebSearch

Các ví dụ bên dưới cho thấy một vài yêu cầu HTTP WebSearch để minh hoạ cách sử dụng các tham số truy vấn khác nhau. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn WebSearch và phần Tham số truy vấn tìm kiếm nâng cao của tài liệu này.

Yêu cầu này yêu cầu 10 kết quả đầu tiên (start=0&num=10) cho cụm từ tìm kiếm "red sox" (q=red+sox). Truy vấn này cũng chỉ định rằng kết quả phải đến từ các trang web của Canada (cr=countryCA) và phải được viết bằng tiếng Pháp (lr=lang_fr). Cuối cùng, truy vấn này chỉ định các giá trị cho các tham số client, outputcx, cả ba tham số này đều bắt buộc.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Ví dụ này sử dụng một số tham số truy vấn tìm kiếm nâng cao để tuỳ chỉnh thêm truy vấn tìm kiếm. Yêu cầu này sử dụng tham số as_q (as_q=red+sox) thay vì tham số q. Lệnh này cũng sử dụng tham số as_eq để loại trừ mọi tài liệu có chứa từ "Yankees" khỏi kết quả tìm kiếm (as_eq=yankees).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Định nghĩa về tham số truy vấn WebSearch

c2coff
Nội dung mô tả

Không bắt buộc. Tham số c2coff cho phép bật hoặc tắt tính năng Tìm kiếm bằng tiếng Trung giản thể và tiếng Trung phồn thể.

Giá trị mặc định của tham số này là 0 (bằng 0), tức là tính năng này được bật. Các giá trị cho thông số c2coff là:

Giá trị Hành động
1 Đã tắt
0 Đang bật
Ví dụ q=google&c2coff=1

khách hàng
Nội dung mô tả

Bắt buộc. Bạn phải đặt tham số client thành google-csbe.

Ví dụ q=google&client=google-csbe

cr
Nội dung mô tả

Không bắt buộc. Tham số cr hạn chế kết quả tìm kiếm đối với những tài liệu có nguồn gốc từ một quốc gia cụ thể. Bạn có thể sử dụng toán tử Boolean trong giá trị của tham số cr.

Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • vị trí địa lý của địa chỉ IP của máy chủ web

Hãy xem phần Giá trị tham số Quốc gia (cr) để biết danh sách các giá trị hợp lệ cho tham số này.

Ví dụ q=Frodo&cr=countryNZ

cx
Nội dung mô tả

Bắt buộc. Tham số cx chỉ định một mã duy nhất xác định một công cụ tìm kiếm tuỳ chỉnh. Bạn phải chỉ định một Công cụ tìm kiếm có thể lập trình bằng cách sử dụng tham số cx để truy xuất kết quả tìm kiếm từ công cụ đó.

Để tìm giá trị của tham số cx, hãy chuyển đến thẻ Bảng điều khiển > Mã của công cụ và bạn sẽ thấy giá trị này trong vùng văn bản bên dưới "Dán mã này vào trang mà bạn muốn hộp tìm kiếm xuất hiện. Kết quả tìm kiếm sẽ xuất hiện trên một trang do Google lưu trữ."

Ví dụ q=Frodo&cx=00255077836266642015:u-scht7a-8i

filter
Nội dung mô tả

Không bắt buộc. Tham số filter sẽ kích hoạt hoặc huỷ kích hoạt tính năng tự động lọc kết quả tìm kiếm trên Google. Hãy xem phần Lọc tự động trong tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google.

Giá trị mặc định cho tham số filter1, cho biết tính năng này được bật. Các giá trị hợp lệ cho tham số này là:

Giá trị Hành động
1 Đã tắt
0 Đang bật

Lưu ý: Theo mặc định, Google áp dụng bộ lọc cho tất cả kết quả tìm kiếm để cải thiện chất lượng của những kết quả đó.

Ví dụ q=google&filter=0

gl
Nội dung mô tả

Không bắt buộc. Giá trị tham số gl là mã quốc gia gồm hai chữ cái. Đối với kết quả WebSearch, tham số gl sẽ tăng cường kết quả tìm kiếm có quốc gia xuất xứ khớp với giá trị tham số. Hãy xem phần Mã quốc gia để biết danh sách các giá trị hợp lệ.

Việc chỉ định giá trị tham số gl trong các yêu cầu WebSearch sẽ giúp cải thiện mức độ liên quan của kết quả. Điều này đặc biệt đúng với khách hàng quốc tế và cụ thể hơn là khách hàng ở các quốc gia nói tiếng Anh ngoài Hoa Kỳ.

Ví dụ

Yêu cầu này giúp tăng thứ hạng cho các tài liệu được viết ở Vương quốc Anh trong kết quả WebSearch:
q=pizza&gl=uk


hl
Nội dung mô tả

Không bắt buộc. Tham số hl chỉ định ngôn ngữ giao diện (ngôn ngữ máy chủ) của giao diện người dùng. Để cải thiện hiệu suất và chất lượng của kết quả tìm kiếm, bạn nên đặt tham số này một cách rõ ràng.

Hãy xem phần Ngôn ngữ giao diện trong phần Quốc tế hoá các cụm từ tìm kiếm và cách trình bày kết quả để biết thêm thông tin và Ngôn ngữ giao diện được hỗ trợ để xem danh sách các ngôn ngữ được hỗ trợ.

Ví dụ

Yêu cầu này nhắm đến quảng cáo về rượu vang bằng tiếng Pháp. (Vin là thuật ngữ tiếng Pháp cho rượu vang.)

q=vin&ip=10.10.10.10&ad=w5&hl=fr

hq
Nội dung mô tả

Không bắt buộc. Tham số hq sẽ nối các cụm từ tìm kiếm đã chỉ định vào truy vấn, như thể chúng được kết hợp với toán tử logic AND.

Ví dụ

Yêu cầu này tìm kiếm "pizza" VÀ "phô mai". Biểu thức này giống với q=pizza+cheese.

q=pizza&hq=cheese


ie
Nội dung mô tả

Không bắt buộc. Tham số ie đặt lược đồ mã hoá ký tự sẽ được dùng để diễn giải chuỗi cụm từ tìm kiếm. Giá trị ie mặc định là latin1.

Hãy xem phần Mã hoá ký tự để biết thông tin thảo luận về thời điểm bạn có thể cần sử dụng tham số này.

Hãy xem phần Các lược đồ mã hoá ký tự để biết danh sách các giá trị ie có thể có.

Ví dụ q=google&ie=utf8&oe=utf8
lr
Nội dung mô tả

Không bắt buộc. Tham số lr (hạn chế ngôn ngữ) hạn chế kết quả tìm kiếm đối với tài liệu được viết bằng một ngôn ngữ cụ thể.

Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • thẻ meta về ngôn ngữ trong tài liệu
  • ngôn ngữ chính được dùng trong nội dung của tài liệu
  • ngôn ngữ phụ (nếu có) được dùng trong nội dung của tài liệu

Hãy xem phần Giá trị tập hợp ngôn ngữ (lr) để biết danh sách các giá trị hợp lệ cho tham số này.

Ví dụ q=Frodo&lr=lang_en

num
Nội dung mô tả

Không bắt buộc. Tham số num xác định số lượng kết quả tìm kiếm cần trả về.

Giá trị num mặc định là 10 và giá trị tối đa là 20. Nếu bạn yêu cầu hơn 20 kết quả, thì chỉ có 20 kết quả được trả về.

Lưu ý: Nếu tổng số kết quả tìm kiếm ít hơn số kết quả được yêu cầu, thì tất cả kết quả tìm kiếm có sẵn sẽ được trả về.

Ví dụ q=google&num=10

oe
Nội dung mô tả

Không bắt buộc. Tham số oe đặt lược đồ mã hoá ký tự sẽ được dùng để giải mã kết quả XML. Giá trị oe mặc định là latin1.

Hãy xem phần Mã hoá ký tự để biết thông tin thảo luận về thời điểm bạn có thể cần sử dụng tham số này.

Hãy xem phần Các lược đồ mã hoá ký tự để biết danh sách các giá trị oe có thể có.

Ví dụ q=google&ie=utf8&oe=utf8

output
Nội dung mô tả

Bắt buộc. Tham số output chỉ định định dạng của kết quả XML. Giá trị hợp lệ duy nhất cho tham số này là xmlxml_no_dtd. Biểu đồ bên dưới giải thích sự khác biệt giữa các giá trị tham số này.

Giá trị Định dạng Trang kết quả
xml_no_dtd Kết quả XML sẽ không bao gồm một câu lệnh !DOCTYPE. (Nên dùng)
xml Kết quả XML sẽ chứa một tài liệu tham khảo DTD của Google. Dòng thứ hai của kết quả sẽ xác định loại định nghĩa tài liệu (DTD) mà kết quả sử dụng:
    <!DOCTYPE GSP SYSTEM "google.dtd">
Ví dụ output=xml_no_dtd
output=xml

q
Nội dung mô tả

Không bắt buộc. Tham số q chỉ định cụm từ tìm kiếm do người dùng nhập. Mặc dù không bắt buộc phải có thông số này, nhưng bạn phải chỉ định giá trị cho ít nhất một trong các thông số truy vấn (as_epq, as_lq, as_oq, as_q để nhận kết quả tìm kiếm.

Ngoài ra, có một số cụm từ tìm kiếm đặc biệt có thể được dùng làm một phần của giá trị tham số q. Vui lòng xem Cụm từ tìm kiếm đặc biệt để biết danh sách và định nghĩa của những cụm từ này.

Bảng điều khiển Google Tìm kiếm có một báo cáo về những cụm từ tìm kiếm hàng đầu được gửi bằng tham số q.

Lưu ý: Giá trị được chỉ định cho tham số q phải được thoát URL.

Ví dụ q=vacation&as_oq=london+paris

an toàn
Nội dung mô tả

Không bắt buộc. Tham số safe cho biết cách lọc kết quả tìm kiếm đối với nội dung người lớn và nội dung khiêu dâm. Giá trị mặc định cho tham số safeoff. Các giá trị tham số hợp lệ là:

Giá trị Hành động
off Tắt tính năng Tìm kiếm an toàn
medium Bật tính năng Tìm kiếm an toàn
high Bật phiên bản nghiêm ngặt hơn của tính năng Tìm kiếm an toàn

Hãy xem phần Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn để biết thêm thông tin chi tiết về tính năng này.

Ví dụ q=adult&safe=high

start
Nội dung mô tả

Không bắt buộc. Tham số start cho biết kết quả trùng khớp đầu tiên cần được đưa vào kết quả tìm kiếm. Tham số start sử dụng chỉ mục dựa trên 0, tức là kết quả đầu tiên là 0, kết quả thứ hai là 1, v.v.

Tham số start hoạt động cùng với tham số num để xác định kết quả tìm kiếm cần trả về. Xin lưu ý rằng không có truy vấn nào trả về quá 1.000 kết quả, ngay cả khi có hơn 1.000 tài liệu khớp với truy vấn. Vì vậy, việc đặt giá trị bắt đầu thành 1.000 trở lên sẽ không tạo ra kết quả.

Ví dụ start=10

sắp xếp
Nội dung mô tả

Không bắt buộc. Tham số sort chỉ định rằng kết quả được sắp xếp theo biểu thức đã chỉ định. Ví dụ: sắp xếp theo ngày.

Ví dụ

sort=date


ud
Nội dung mô tả

Không bắt buộc. Tham số ud cho biết liệu phản hồi XML có nên bao gồm URL được mã hoá IDN cho kết quả tìm kiếm hay không. Mã hoá IDN (Tên miền quốc tế hoá) cho phép hiển thị các miền bằng ngôn ngữ địa phương, ví dụ:

http://www.花井鮨.com

Các giá trị hợp lệ cho tham số này là 1 (mặc định), tức là kết quả XML phải bao gồm các URL được mã hoá IDN và 0, tức là kết quả XML không được bao gồm các URL được mã hoá IDN. Nếu tham số ud được đặt thành 1, thì URL được mã hoá IDN sẽ xuất hiện trong thẻ UD trong kết quả XML.

Nếu tham số ud được đặt thành 0, thì URL trong ví dụ ở trên sẽ xuất hiện như sau:

http://www.xn--elq438j.com.

Lưu ý: Đây là một tính năng thử nghiệm.

Ví dụ q=google&ud=1

Các tham số truy vấn bổ sung được liệt kê bên dưới hình ảnh có liên quan đến cụm từ tìm kiếm nâng cao. Khi bạn gửi một cụm từ tìm kiếm nâng cao, các giá trị của một số tham số (ví dụ: as_eq, as_epq, as_oq, v.v.) đều được đưa vào cụm từ tìm kiếm cho cụm từ tìm kiếm đó. Hình ảnh này cho thấy trang Tìm kiếm nâng cao của Google. Trên hình ảnh, tên của từng tham số tìm kiếm nâng cao được viết bằng văn bản màu đỏ bên trong hoặc bên cạnh trường trên trang mà tham số đó tương ứng.



Tham số truy vấn tìm kiếm nâng cao

as_dt
Nội dung mô tả

Không bắt buộc. Tham số as_dt kiểm soát việc có bao gồm hay loại trừ kết quả từ trang web có tên trong tham số as_sitesearch hay không. Các giá trị ie lần lượt biểu thị việc bao gồm và loại trừ.

Ví dụ as_dt=i,as_dt=e

as_epq
Nội dung mô tả

Không bắt buộc. Tham số as_epq xác định một cụm từ mà tất cả tài liệu trong kết quả tìm kiếm phải chứa. Bạn cũng có thể sử dụng cụm từ tìm kiếm tìm kiếm cụm từ để tìm một cụm từ.

Ví dụ as_epq=abraham+lincoln

as_eq
Nội dung mô tả

Không bắt buộc. Tham số as_eq xác định một từ hoặc cụm từ không được xuất hiện trong bất kỳ tài liệu nào trong kết quả tìm kiếm. Bạn cũng có thể sử dụng cụm từ tìm kiếm loại trừ để đảm bảo rằng một từ hoặc cụm từ cụ thể sẽ không xuất hiện trong các tài liệu trong một nhóm kết quả tìm kiếm.

Ví dụ

q=bass&as_eq=music.


as_lq
Nội dung mô tả

Không bắt buộc. Tham số as_lq chỉ định rằng tất cả kết quả tìm kiếm phải chứa một đường liên kết đến một URL cụ thể. Bạn cũng có thể sử dụng cụm từ tìm kiếm link: cho loại truy vấn này.

Ví dụ

as_lq=www.google.com


as_nlo
Nội dung mô tả

Không bắt buộc. Tham số as_nlo chỉ định giá trị bắt đầu cho một phạm vi tìm kiếm. Sử dụng as_nloas_nhi để thêm một phạm vi tìm kiếm bao gồm as_nlo...as_nhi vào truy vấn.

Ví dụ

Sau đây đặt phạm vi tìm kiếm từ 5 đến 10, bao gồm cả 5 và 10:

as_nlo=5&as_nhi=10

as_nhi
Nội dung mô tả

Không bắt buộc. Tham số as_nhi chỉ định giá trị kết thúc cho một phạm vi tìm kiếm. Sử dụng as_nloas_nhi để thêm một phạm vi tìm kiếm bao gồm as_nlo...as_nhi vào truy vấn.

Ví dụ

Sau đây đặt phạm vi tìm kiếm từ 5 đến 10, bao gồm cả 5 và 10:

as_nlo=5&as_nhi=10

as_oq
Nội dung mô tả

Không bắt buộc. Tham số as_oq cung cấp các cụm từ tìm kiếm bổ sung để kiểm tra trong một tài liệu, trong đó mỗi tài liệu trong kết quả tìm kiếm phải chứa ít nhất một trong các cụm từ tìm kiếm bổ sung. Bạn cũng có thể sử dụng cụm từ tìm kiếm Boolean OR cho loại truy vấn này.

Ví dụ

q=vacation&as_oq=London+Paris


as_q
Nội dung mô tả

Không bắt buộc. Tham số as_q cung cấp cụm từ tìm kiếm để kiểm tra trong một tài liệu. Thông số này cũng thường được dùng để cho phép người dùng chỉ định các cụm từ bổ sung để tìm kiếm trong một nhóm kết quả tìm kiếm.

Ví dụ

q=president&as_q=John+Adams


as_qdr
Nội dung mô tả

Không bắt buộc. Tham số as_qdr yêu cầu kết quả tìm kiếm trong một khoảng thời gian cụ thể (phạm vi ngày nhanh). Các giá trị sau được hỗ trợ:

d[number] yêu cầu kết quả từ số ngày đã qua được chỉ định.
w[number] yêu cầu kết quả từ số tuần trước được chỉ định.
m[number] yêu cầu kết quả từ số tháng trước được chỉ định.
y[number] yêu cầu kết quả từ số năm trước được chỉ định.

Ví dụ

Ví dụ này yêu cầu kết quả trong năm vừa qua:

as_qdr=y

Ví dụ này yêu cầu kết quả trong 10 ngày qua:

as_qdr=d10

as_sitesearch
Nội dung mô tả

Không bắt buộc. Tham số as_sitesearch cho phép bạn chỉ định rằng tất cả kết quả tìm kiếm phải là các trang của một trang web nhất định. Bằng cách đặt tham số as_dt, bạn cũng có thể sử dụng tham số này để loại trừ các trang khỏi một trang web nhất định trong kết quả tìm kiếm.

Ví dụ

q=vacation&as_sitesearch=www.google.com


Cụm từ tìm kiếm đặc biệt

Google WebSearch cho phép sử dụng một số cụm từ tìm kiếm đặc biệt để truy cập vào các chức năng bổ sung của công cụ tìm kiếm của Google. Bạn nên đưa các cụm từ tìm kiếm đặc biệt này vào giá trị của tham số yêu cầu q. Giống như các cụm từ tìm kiếm khác, các cụm từ tìm kiếm đặc biệt phải được thoát URL. Một số cụm từ tìm kiếm đặc biệt có chứa dấu hai chấm (:). Ký tự này cũng phải được chuyển đổi ký tự URL; giá trị được chuyển đổi ký tự URL của ký tự này là %3A.

Đường liên kết ngược [link:]
Nội dung mô tả

Cụm từ tìm kiếm link: truy xuất tập hợp các trang trên Web liên kết đến một URL cụ thể. Cụm từ tìm kiếm phải có định dạng là link:URL và không có khoảng trống giữa cụm từ tìm kiếm link: và URL.

Phiên bản có ký tự thoát URL của link:link%3A.

Bạn cũng có thể sử dụng tham số yêu cầu as_lq để gửi yêu cầu link:.

Lưu ý: Bạn không thể chỉ định bất kỳ cụm từ tìm kiếm nào khác khi sử dụng link:.

Ví dụ

http://www.google.com/search?q=link%3Awww.example.com


Tìm kiếm bằng toán tử OR (hoặc) [ OR ]
Nội dung mô tả

Cụm từ tìm kiếm OR truy xuất những tài liệu có chứa một trong số các cụm từ tìm kiếm (từ 2 cụm từ trở lên). Để sử dụng cụm từ tìm kiếm OR, bạn sẽ chèn cụm từ tìm kiếm OR (bằng chữ in hoa) giữa mỗi cụm từ trong chuỗi.

Bạn cũng có thể sử dụng tham số yêu cầu as_oq để gửi yêu cầu tìm kiếm cho bất kỳ cụm từ nào trong một tập hợp cụm từ.

Lưu ý: Nếu một yêu cầu tìm kiếm chỉ định cụm từ tìm kiếm "London+OR+Paris", thì kết quả tìm kiếm sẽ bao gồm những tài liệu chứa ít nhất một trong hai từ đó. Trong một số trường hợp, tài liệu trong kết quả tìm kiếm có thể chứa cả hai từ.

Ví dụ

Tìm kiếm London hoặc Paris:

Hoạt động đầu vào của người dùng:london OR paris Cụm từ tìm kiếm:q=london+OR+paris

Tìm kiếm kỳ nghỉ và London hoặc Paris:

Cụm từ tìm kiếm:q=vacation+london+OR+paris

Tìm kiếm kỳ nghỉ và một trong các từ khoá London, Paris hoặc sô cô la:

Cụm từ tìm kiếm:  q=vacation+london+OR+paris+OR+chocolates

Tìm kiếm kỳ nghỉ và sô cô la, cũng như london hoặc paris, trong đó sô cô la được gán trọng số thấp nhất:

Cụm từ tìm kiếm:  q=vacation+london+OR+paris+chocolates

Tìm thông tin về kỳ nghỉ, sô cô la và hoa trong những tài liệu cũng có chứa London hoặc Paris:

Cụm từ tìm kiếm:  q=vacation+london+OR+paris+chocolates+flowers

Tìm kiếm kỳ nghỉ và một trong hai địa điểm London hoặc Paris, đồng thời tìm kiếm một trong hai sản phẩm sô cô la hoặc hoa:

Cụm từ tìm kiếm:  q=vacation+london+OR+paris+chocolates+OR+flowers

Loại trừ cụm từ tìm kiếm [-]
Nội dung mô tả

Cụm từ tìm kiếm loại trừ (-) hạn chế kết quả cho một yêu cầu tìm kiếm cụ thể đối với những tài liệu không chứa một từ hoặc cụm từ cụ thể. Để sử dụng cụm từ tìm kiếm loại trừ, bạn sẽ đặt "-" (dấu trừ) trước từ hoặc cụm từ cần loại trừ khỏi các tài liệu khớp.

Phiên bản có ký tự thoát URL của -%2D.

Cụm từ tìm kiếm loại trừ sẽ hữu ích khi một cụm từ tìm kiếm có nhiều nghĩa. Ví dụ: từ "bass" có thể trả về kết quả về cá hoặc nhạc. Nếu đang tìm tài liệu về cá, bạn có thể loại trừ tài liệu về nhạc khỏi kết quả tìm kiếm bằng cách sử dụng cụm từ tìm kiếm loại trừ.

Bạn cũng có thể sử dụng tham số yêu cầu as_eq để loại trừ những tài liệu có chứa một từ hoặc cụm từ cụ thể khỏi kết quả tìm kiếm.

Ví dụ Hoạt động đầu vào của người dùng: bass -music
Cụm từ tìm kiếm: q=bass+%2Dmusic

Loại trừ loại tệp [ -filetype: ]
Nội dung mô tả

Cụm từ tìm kiếm -filetype: sẽ loại trừ những tài liệu có một đuôi tệp cụ thể, chẳng hạn như ".pdf" hoặc ".doc" khỏi kết quả tìm kiếm. Cụm từ tìm kiếm phải được định dạng là -filetype:EXTENSION mà không có khoảng trắng giữa cụm từ tìm kiếm -filetype: và tiện ích được chỉ định.

Phiên bản có ký tự thoát URL của -filetype:%2Dfiletype%3A.

Lưu ý: Bạn có thể loại trừ nhiều loại tệp khỏi kết quả tìm kiếm bằng cách thêm nhiều cụm từ tìm kiếm -filetype: vào cụm từ tìm kiếm. Bạn nên có một cụm từ tìm kiếm -filetype: trong cụm từ tìm kiếm cho mỗi đuôi tệp cần loại trừ khỏi kết quả tìm kiếm.

Các loại tệp mà Google hỗ trợ bao gồm:

  • Định dạng tài liệu di động của Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Lotus WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản giàu tính chất (RTF)
  • Shockwave Flash (swf)
  • Văn bản (ans, txt).

Sau này, chúng tôi có thể thêm các loại tệp khác. Bạn luôn có thể xem danh sách mới nhất trong câu hỏi thường gặp về loại tệp của Google.

Ví dụ

Ví dụ này trả về những tài liệu đề cập đến "Google" nhưng không phải là tài liệu PDF:
q=Google+%2Dfiletype%3Apdf

Ví dụ này trả về những tài liệu đề cập đến "Google" nhưng loại trừ cả tài liệu PDF và Word:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


Lọc theo loại tệp [ filetype: ]
Nội dung mô tả

Cụm từ tìm kiếm filetype: giới hạn kết quả tìm kiếm trong các tài liệu có một đuôi tệp cụ thể, chẳng hạn như ".pdf" hoặc ".doc". Cụm từ tìm kiếm phải có định dạng filetype:EXTENSION mà không có dấu cách giữa cụm từ tìm kiếm filetype: và đuôi tệp được chỉ định.

Phiên bản có ký tự thoát URL của filetype:filetype%3A.

Bạn có thể giới hạn kết quả tìm kiếm ở những tài liệu khớp với một trong số các đuôi tệp bằng cách thêm nhiều cụm từ tìm kiếm filetype: vào cụm từ tìm kiếm của mình. Bạn nên có một cụm từ tìm kiếm filetype: trong cụm từ tìm kiếm cho mỗi đuôi tệp cần có trong kết quả tìm kiếm. Bạn phải phân tách nhiều cụm từ tìm kiếm filetype: bằng cụm từ tìm kiếm OR.

Theo mặc định, kết quả tìm kiếm sẽ bao gồm các tài liệu có đuôi tệp bất kỳ.

Các loại tệp mà Google hỗ trợ bao gồm:

  • Định dạng tài liệu di động của Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Lotus WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản giàu tính chất (RTF)
  • Shockwave Flash (swf)
  • Văn bản (ans, txt).

Sau này, chúng tôi có thể thêm các loại tệp khác. Bạn luôn có thể xem danh sách mới nhất trong câu hỏi thường gặp về loại tệp của Google.

Ví dụ

Ví dụ này trả về các tài liệu PDF có đề cập đến "Google":
q=Google+filetype%3Apdf

Ví dụ này trả về các tài liệu PDF và Word có đề cập đến "Google":
q=Google+filetype%3Apdf+OR+filetype%3Adoc


Bao gồm cụm từ tìm kiếm [+]
Nội dung mô tả

Cụm từ tìm kiếm bao gồm (+) chỉ định rằng một từ hoặc cụm từ phải xuất hiện trong tất cả các tài liệu có trong kết quả tìm kiếm. Để sử dụng cụm từ tìm kiếm bao gồm, bạn sẽ đặt "+" (dấu cộng) trước từ hoặc cụm từ phải có trong tất cả kết quả tìm kiếm.

Phiên bản thoát URL của + (dấu cộng) là %2B.

Bạn nên sử dụng + trước một từ thông thường mà Google thường loại bỏ trước khi xác định kết quả tìm kiếm.

Ví dụ Hoạt động đầu vào của người dùng: Star Wars Episode +I
Cụm từ tìm kiếm: q=Star+Wars+Episode+%2BI

Chỉ tìm đường liên kết, tất cả các cụm từ [ allinlinks: ]
Nội dung mô tả

Cụm từ tìm kiếm allinlinks: yêu cầu các tài liệu trong kết quả tìm kiếm phải chứa tất cả các từ trong cụm từ tìm kiếm trong đường liên kết URL. Cụm từ tìm kiếm phải có định dạng là allinlinks:, theo sau là các từ trong cụm từ tìm kiếm.

Nếu cụm từ tìm kiếm của bạn có chứa cụm từ tìm kiếm allinlinks:, thì Google sẽ chỉ kiểm tra các đường liên kết URL trong tài liệu đối với những từ trong cụm từ tìm kiếm của bạn, bỏ qua văn bản khác trong tài liệu, tiêu đề tài liệu và URL của từng tài liệu. Xin lưu ý rằng URL tài liệu khác với các đường liên kết URL có trong tài liệu.

Phiên bản có ký tự thoát URL của allinlinks:allinlinks%3A.

Ví dụ Hoạt động đầu vào của người dùng:allinlinks: Google search
Cụm từ tìm kiếm:q=allinlinks%3A+Google+search

Tìm kiếm cụm từ
Nội dung mô tả

Cụm từ tìm kiếm (") cho phép bạn tìm kiếm các cụm từ hoàn chỉnh bằng cách đặt cụm từ trong dấu ngoặc kép hoặc bằng cách kết nối các cụm từ đó bằng dấu gạch ngang.

Phiên bản có ký tự thoát của " (dấu ngoặc kép) là %22.

Cụm từ tìm kiếm đặc biệt hữu ích nếu bạn đang tìm kiếm các câu trích dẫn nổi tiếng hoặc tên riêng.

Bạn cũng có thể sử dụng tham số yêu cầu as_epq để gửi một cụm từ tìm kiếm.

Ví dụ Hoạt động đầu vào của người dùng:"Abraham Lincoln"
Cụm từ tìm kiếm: q=%22Abraham+Lincoln%22


Thông tin về tài liệu trên web [info:]
Nội dung mô tả

Cụm từ tìm kiếm info: sẽ truy xuất thông tin chung về một URL, miễn là URL đó có trong chỉ mục tìm kiếm của Google. Cụm từ tìm kiếm phải có định dạng là info:URL mà không có khoảng trắng giữa cụm từ tìm kiếm info: và URL.

Phiên bản thoát URL của info:info%3A.

Lưu ý: Bạn không thể chỉ định bất kỳ cụm từ tìm kiếm nào khác khi sử dụng info:.

Ví dụ Hoạt động đầu vào của người dùng: info:www.google.com
Cụm từ tìm kiếm: q=info%3Awww.google.com

Cụm từ tìm kiếm mẫu cho hình ảnh

Các ví dụ bên dưới cho thấy một vài yêu cầu HTTP về hình ảnh để minh hoạ cách sử dụng các tham số truy vấn khác nhau. Định nghĩa về các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa về tham số truy vấn hình ảnh của tài liệu này.

Yêu cầu này yêu cầu 5 kết quả đầu tiên (start=0&num=5) cho cụm từ tìm kiếm "monkey" (q=monkey), thuộc loại tệp .png. Cuối cùng, truy vấn chỉ định các giá trị cho tham số client, outputcx. Cả 3 tham số này đều là bắt buộc.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Tham số truy vấn tìm kiếm hình ảnh

as_filetype
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh thuộc một loại cụ thể. Các giá trị được phép là: bmp, gif, png, jpgsvg.

Ví dụ q=google&as_filetype=png

imgsz
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh có kích thước được chỉ định, trong đó kích thước có thể là một trong những kích thước sau:

  • icon (nhỏ)
  • small|medium|large|xlarge (trung bình)
  • xxlarge (lớn)
  • huge (rất lớn)

Ví dụ q=google&as_filetype=png&imgsz=icon

imgtype
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh thuộc một loại, có thể là một trong những loại sau:

  • clipart (hình minh hoạ)
  • face (khuôn mặt)
  • lineart (lineart)
  • news (tin tức)
  • photo (ảnh)

Ví dụ q=google&as_filetype=png&imgtype=photo

imgc
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh đen trắng, thang độ xám hoặc hình ảnh có màu:

  • mono (trắng đen)
  • gray (thang màu xám)
  • color (màu sắc)

Ví dụ q=google&as_filetype=png&imgc=gray

imgcolor
Nội dung mô tả

Không bắt buộc. Trả về hình ảnh có một màu chủ đạo cụ thể:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
Ví dụ q=google&as_filetype=png&imgcolor=yellow

as_rights
Nội dung mô tả

Không bắt buộc. Bộ lọc dựa trên việc cấp phép. Các giá trị được hỗ trợ bao gồm:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

Ví dụ q=cats&as_filetype=png&as_rights=cc_attribute

Giới hạn yêu cầu

Biểu đồ dưới đây liệt kê các giới hạn đối với những yêu cầu tìm kiếm mà bạn gửi đến Google:

Thành phần Hạn mức Bình luận
Độ dài yêu cầu tìm kiếm 2048 byte  
Số lượng cụm từ tìm kiếm 10 bao gồm các cụm từ trong những tham số sau: q, as_epq, as_eq, as_lq, as_oq, as_q
Số kết quả 20 Nếu đặt tham số num thành một số lớn hơn 20, thì chỉ có 20 kết quả được trả về. Để nhận thêm kết quả, bạn cần gửi nhiều yêu cầu và tăng giá trị của tham số start theo từng yêu cầu.

Quốc tế hoá truy vấn và cách trình bày kết quả

Dịch vụ Google WebSearch cho phép bạn tìm kiếm tài liệu bằng nhiều ngôn ngữ. Bạn có thể chỉ định phương thức mã hoá ký tự sẽ được dùng để diễn giải yêu cầu HTTP và mã hoá phản hồi XML (bằng cách sử dụng các tham số tìm kiếm ieoe). Bạn cũng có thể lọc kết quả để chỉ bao gồm những tài liệu được viết bằng một số ngôn ngữ nhất định.

Các phần sau đây thảo luận về những vấn đề liên quan đến việc tìm kiếm bằng nhiều ngôn ngữ:

Mã hoá ký tự

Các máy chủ gửi dữ liệu (chẳng hạn như trang web) đến các tác nhân người dùng (chẳng hạn như trình duyệt) dưới dạng một chuỗi gồm các byte được mã hoá. Sau đó, tác nhân người dùng sẽ giải mã các byte thành một chuỗi ký tự. Khi gửi yêu cầu đến dịch vụ WebSearch, bạn có thể chỉ định các lược đồ mã hoá cho cả cụm từ tìm kiếm và phản hồi XML mà bạn nhận được.

Bạn có thể sử dụng tham số yêu cầu ie để chỉ định cơ chế mã hoá cho các ký tự trong yêu cầu HTTP. Bạn cũng có thể sử dụng tham số oe để chỉ định lược đồ mã hoá mà Google sẽ dùng để mã hoá phản hồi XML của bạn. Nếu bạn đang sử dụng một sơ đồ mã hoá khác ngoài ISO-8859-1 (hoặc latin1), vui lòng đảm bảo rằng bạn chỉ định đúng giá trị cho các tham số ieoe.

Lưu ý: Nếu đang cung cấp chức năng tìm kiếm cho nhiều ngôn ngữ, bạn nên sử dụng giá trị mã hoá utf8 (UTF-8) cho cả tham số ieoe.

Vui lòng tham khảo phụ lục Các lược đồ mã hoá ký tự để xem danh sách đầy đủ các giá trị mà bạn có thể dùng cho các tham số ieoe.

Để biết thêm thông tin chung về cách mã hoá ký tự, vui lòng xem tại http://www.w3.org/TR/REC-html40/charset.html.

Ngôn ngữ giao diện

Bạn có thể sử dụng tham số yêu cầu hl để xác định ngôn ngữ của giao diện đồ hoạ. Giá trị tham số hl có thể ảnh hưởng đến kết quả tìm kiếm XML, đặc biệt là đối với các cụm từ tìm kiếm quốc tế khi bạn không chỉ định rõ ràng chế độ hạn chế ngôn ngữ (bằng cách sử dụng tham số lr). Trong những trường hợp như vậy, tham số hl có thể thúc đẩy kết quả tìm kiếm bằng cùng ngôn ngữ với ngôn ngữ đầu vào của người dùng.

Bạn nên đặt rõ ràng tham số hl trong kết quả tìm kiếm để đảm bảo Google chọn kết quả tìm kiếm có chất lượng cao nhất cho mỗi cụm từ tìm kiếm.

Vui lòng xem phần Ngôn ngữ giao diện được hỗ trợ để biết danh sách đầy đủ các giá trị hợp lệ cho tham số hl.

Tìm kiếm tài liệu được viết bằng một số ngôn ngữ cụ thể

Bạn có thể sử dụng thông số yêu cầu lr để hạn chế kết quả tìm kiếm đối với những tài liệu được viết bằng một ngôn ngữ hoặc một nhóm ngôn ngữ cụ thể.

Tham số lr hỗ trợ Toán tử Boolean để cho phép bạn chỉ định nhiều ngôn ngữ cần được đưa vào (hoặc loại trừ) khỏi kết quả tìm kiếm.

Các ví dụ sau đây cho thấy cách bạn có thể sử dụng Toán tử Boolean để yêu cầu tài liệu bằng nhiều ngôn ngữ.

Đối với tài liệu viết bằng tiếng Nhật:

lr=lang_jp

Đối với tài liệu được viết bằng tiếng Ý hoặc tiếng Đức:

lr=lang_it|lang_de

Đối với những tài liệu không được viết bằng tiếng Hungary hoặc tiếng Séc:

lr=(-lang_hu).(-lang_cs)

Vui lòng xem phần Giá trị tập hợp ngôn ngữ để biết danh sách đầy đủ các giá trị có thể có cho tham số lr và phần Toán tử Boolean để biết nội dung thảo luận đầy đủ về việc sử dụng các toán tử này.

Tiếng Trung giản thể và tiếng Trung phồn thể là hai biến thể chữ viết của tiếng Trung. Cùng một khái niệm có thể được viết theo cách khác nhau trong mỗi biến thể. Với một truy vấn trong một trong các biến thể, dịch vụ Google WebSearch có thể trả về kết quả bao gồm các trang ở cả hai biến thể.

Cách dùng tính năng này:

  1. Đặt tham số yêu cầu c2coff thành 0
  2. Thực hiện một trong các hành động sau:
    • Không đặt tham số yêu cầu lr
      hoặc
    • Đặt tham số yêu cầu lr thành lr=lang_zh-TW|lang_zh-CN

Ví dụ sau đây cho thấy các tham số truy vấn mà bạn sẽ đưa vào yêu cầu để nhận kết quả bằng cả tiếng Trung giản thể và tiếng Trung phồn thể. (Xin lưu ý rằng thông tin bắt buộc bổ sung, chẳng hạn như máy khách, không có trong ví dụ này.)

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

Lọc kết quả

Google Tìm kiếm trên web cung cấp một số cách để lọc kết quả tìm kiếm:

Tự động lọc kết quả tìm kiếm

Nhằm cung cấp kết quả tìm kiếm phù hợp nhất có thể, Google sử dụng 2 kỹ thuật để tự động lọc ra những kết quả tìm kiếm thường bị coi là không mong muốn:

  • Nội dung trùng lặp – Nếu nhiều tài liệu chứa cùng một thông tin, thì chỉ tài liệu có liên quan nhất trong nhóm đó mới được đưa vào kết quả tìm kiếm của bạn.

  • Lọc kết quả tìm kiếm không mong muốn – Nếu có nhiều kết quả tìm kiếm từ cùng một trang web, thì Google có thể không hiển thị tất cả kết quả từ trang web đó hoặc có thể hiển thị kết quả ở thứ hạng thấp hơn
    so với thứ hạng lẽ ra kết quả đó có được.

Bạn nên bật các bộ lọc này cho các yêu cầu tìm kiếm thông thường vì các bộ lọc này giúp nâng cao đáng kể chất lượng của hầu hết kết quả tìm kiếm. Tuy nhiên, bạn có thể bỏ qua các bộ lọc tự động này bằng cách đặt tham số truy vấn filter thành 0 trong yêu cầu tìm kiếm.

Lọc theo ngôn ngữ và quốc gia

Dịch vụ Google WebSearch trả về kết quả từ một chỉ mục chính gồm tất cả các tài liệu trên web. Chỉ mục chính chứa các tập hợp con gồm các tài liệu được nhóm theo những thuộc tính cụ thể, như ngôn ngữ và quốc gia xuất xứ.

Bạn có thể sử dụng các thông số yêu cầu lrcr để hạn chế kết quả tìm kiếm theo các tập hợp con của tài liệu được viết bằng một số ngôn ngữ cụ thể hoặc có nguồn gốc từ một số quốc gia cụ thể, tương ứng.

Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • thẻ meta về ngôn ngữ trong tài liệu
  • ngôn ngữ chính được dùng trong nội dung của tài liệu


Vui lòng xem thêm định nghĩa về thông số lr, phần Tìm kiếm tài liệu được viết bằng một số ngôn ngữ cụ thểGiá trị của bộ sưu tập ngôn ngữ có thể được dùng làm giá trị cho thông số lr để biết thêm thông tin về việc hạn chế kết quả dựa trên ngôn ngữ.

Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • vị trí địa lý của địa chỉ IP của máy chủ web

Vui lòng xem định nghĩa về tham số crGiá trị của bộ sưu tập quốc gia có thể dùng làm giá trị cho tham số cr để biết thêm thông tin về việc hạn chế kết quả theo quốc gia xuất xứ.

Lưu ý: Bạn có thể kết hợp các giá trị ngôn ngữ và giá trị quốc gia để tuỳ chỉnh kết quả tìm kiếm. Ví dụ: bạn có thể yêu cầu cung cấp tài liệu được viết bằng tiếng Pháp và đến từ Pháp hoặc Canada, hoặc bạn có thể yêu cầu cung cấp tài liệu đến từ Hà Lan và không được viết bằng tiếng Anh. Cả hai tham số lrcr đều hỗ trợ Toán tử Boolean.

Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn

Nhiều khách hàng của Google không muốn hiển thị kết quả tìm kiếm cho những trang web có nội dung người lớn. Khi sử dụng bộ lọc Tìm kiếm an toàn, bạn có thể sàng lọc và loại bỏ những kết quả tìm kiếm chứa nội dung người lớn. Bộ lọc của Google sử dụng công nghệ độc quyền để kiểm tra từ khoá, cụm từ và URL. Mặc dù không có bộ lọc nào chính xác 100%, nhưng tính năng Tìm kiếm an toàn sẽ loại bỏ phần lớn nội dung người lớn khỏi kết quả tìm kiếm của bạn.

Google luôn nỗ lực để giữ cho tính năng Tìm kiếm an toàn được cập nhật và toàn diện nhất có thể bằng cách liên tục thu thập dữ liệu trên web và kết hợp các thông tin cập nhật từ đề xuất của người dùng.

Tính năng Tìm kiếm an toàn hỗ trợ các ngôn ngữ sau:

Tiếng Hà Lan
Tiếng Anh
Tiếng Pháp
Tiếng Đức
Tiếng Ý
Tiếng Bồ Đào Nha (Brazil)
Tiếng Tây Ban Nha
Tiếng Trung phồn thể

Bạn có thể điều chỉnh mức độ lọc nội dung người lớn trong kết quả tìm kiếm của Google bằng cách sử dụng tham số truy vấn an toàn. Bảng sau đây giải thích các chế độ cài đặt Tìm kiếm an toàn của Google và mức độ ảnh hưởng của các chế độ cài đặt đó đến kết quả tìm kiếm của bạn:

Cấp độ Tìm kiếm an toàn Mô tả
cao Cho phép sử dụng phiên bản tìm kiếm an toàn nghiêm ngặt hơn.
trung bình Chặn các trang web chứa nội dung khiêu dâm và nội dung tình dục phản cảm khác.
tắt Không lọc nội dung người lớn khỏi kết quả tìm kiếm.

* Chế độ cài đặt mặc định của tính năng Tìm kiếm an toàn là tắt.

Nếu bạn đã kích hoạt tính năng Tìm kiếm an toàn và thấy những trang web chứa nội dung phản cảm trong kết quả, vui lòng gửi URL của trang web đó đến địa chỉ safesearch@google.com. Chúng tôi sẽ điều tra trang web đó.

Kết quả XML

DTD kết quả XML của Google

Google sử dụng cùng một DTD để mô tả định dạng XML cho tất cả các loại kết quả tìm kiếm. Nhiều thẻ và thuộc tính áp dụng cho tất cả các loại tìm kiếm. Tuy nhiên, một số thẻ chỉ áp dụng cho một số loại tìm kiếm nhất định. Do đó, các định nghĩa trong DTD có thể ít hạn chế hơn so với các định nghĩa được đưa ra trong tài liệu này.

Tài liệu này mô tả những khía cạnh của DTD có liên quan đến WebSearch. Khi xem DTD, nếu đang làm việc trên WebSearch, bạn có thể yên tâm bỏ qua những thẻ và thuộc tính không được ghi lại ở đây. Nếu định nghĩa khác nhau giữa DTD và tài liệu, thì thực tế đó sẽ được ghi chú trong tài liệu này.

Google có thể trả về kết quả XML có hoặc không có thông tin tham chiếu đến DTD gần đây nhất. DTD là hướng dẫn giúp quản trị viên tìm kiếm và trình phân tích cú pháp XML hiểu được kết quả XML của Google. Vì ngữ pháp XML của Google có thể thay đổi theo thời gian, nên bạn không được định cấu hình trình phân tích cú pháp để sử dụng DTD nhằm xác thực từng kết quả XML.

Ngoài ra, bạn không nên định cấu hình trình phân tích cú pháp XML để tìm nạp DTD mỗi khi gửi yêu cầu tìm kiếm. Google hiếm khi cập nhật DTD và những yêu cầu này tạo ra sự chậm trễ và các yêu cầu không cần thiết về băng thông.

Bạn nên sử dụng định dạng đầu ra xml_no_dtd để nhận kết quả XML. Nếu bạn chỉ định định dạng xml output trong yêu cầu tìm kiếm, thì điểm khác biệt duy nhất là việc đưa dòng sau vào kết quả XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

Bạn có thể truy cập vào DTD mới nhất tại http://www.google.com/google.dtd.

Xin lưu ý rằng một số tính năng trong DTD có thể không được cung cấp hoặc hỗ trợ tại thời điểm này.

Giới thiệu về phản hồi XML

  • Tất cả các giá trị phần tử đều là HTML hợp lệ, phù hợp để hiển thị, trừ phi có lưu ý khác trong phần định nghĩa thẻ XML.
  • Một số giá trị phần tử là URL cần được mã hoá HTML trước khi hiển thị.
  • Trình phân tích cú pháp XML của bạn sẽ bỏ qua các thuộc tính và thẻ không có trong tài liệu. Điều này cho phép ứng dụng của bạn tiếp tục hoạt động mà không cần sửa đổi nếu Google thêm các tính năng khác vào đầu ra XML.
  • Bạn phải thoát một số ký tự nhất định khi đưa các ký tự đó vào làm giá trị trong thẻ XML. Trình xử lý XML của bạn phải chuyển đổi các thực thể này trở lại thành các ký tự thích hợp. Ví dụ: nếu bạn không chuyển đổi thực thể đúng cách, trình duyệt có thể hiển thị ký tự & dưới dạng "&amp;". Tiêu chuẩn XML ghi lại các ký tự này; các ký tự này được sao chép trong bảng dưới đây:

    Ký tự Biểu mẫu thoát Thực thể Mã ký tự
    Ký hiệu & & &amp; &#38;
    Dấu nháy đơn ' &apos; &#39;
    Dấu nháy kép " &quot; &#34;
    Dấu lớn hơn > &gt; &#62;
    Dấu nhỏ hơn < &lt; &#60;

Kết quả XML cho cụm từ tìm kiếm thông thường và nâng cao

Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML

Yêu cầu WebSearch mẫu này yêu cầu 10 kết quả (num=10) về cụm từ tìm kiếm "socer" (q=socer), đây là từ "soccer" được cố ý viết sai chính tả cho ví dụ này.)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

Yêu cầu này sẽ tạo ra kết quả XML bên dưới. Xin lưu ý rằng có một số nhận xét trong kết quả XML để cho biết vị trí xuất hiện của một số thẻ không có trong kết quả.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/

<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/

<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/

</RES>
</GSP>

Tìm kiếm thông thường/nâng cao: Thẻ XML

Phản hồi XML cho các yêu cầu tìm kiếm thông thường và yêu cầu tìm kiếm nâng cao đều sử dụng cùng một nhóm thẻ XML. Các thẻ XML này xuất hiện trong ví dụ về XML ở trên và được giải thích trong các bảng bên dưới.

Các thẻ XML bên dưới được liệt kê theo thứ tự bảng chữ cái theo tên thẻ và mỗi định nghĩa thẻ đều có nội dung mô tả về thẻ, ví dụ minh hoạ cách thẻ sẽ xuất hiện trong kết quả XML và định dạng nội dung của thẻ. Nếu thẻ là thẻ con của một thẻ XML khác hoặc nếu thẻ có thẻ con hoặc thuộc tính riêng, thì thông tin đó cũng được cung cấp trong bảng định nghĩa của thẻ.

Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:

? = thẻ phụ không bắt buộc
* = không hoặc nhiều phiên bản của thẻ phụ
+ = một hoặc nhiều phiên bản của thẻ phụ
Đáp B D Khắc phục G H I L M B P Hỏi R N T U X

anchor_text
Định nghĩa

Thẻ <anchor_text> chỉ định văn bản mà bạn nên hiển thị cho người dùng để xác định một nhãn tinh chỉnh được liên kết với một tập hợp kết quả tìm kiếm. Vì nhãn tinh chỉnh thay thế các ký tự không phải chữ và số bằng dấu gạch dưới, nên bạn không được hiển thị giá trị của thẻ <label> trong giao diện người dùng. Thay vào đó, bạn nên hiển thị giá trị của thẻ <anchor_text>.

Ví dụ <anchor_text>sân golf</anchor_text>
Thẻ phụ của FacetItem
Định dạng nội dung Văn bản

CHẶN
Định nghĩa

Thẻ này bao bọc nội dung của một khối trong dòng nội dung của kết quả quảng bá. Mỗi khối có các thẻ phụ T, UL. Thẻ T không trống cho biết khối chứa văn bản; thẻ UL không trống cho biết khối chứa một đường liên kết (với URL được cung cấp trong thẻ phụ U và văn bản liên kết trong thẻ phụ L).

Thẻ phụ T, U, L
Thẻ phụ của BODY_LINE
Định dạng nội dung Trống

BODY_LINE
Định nghĩa

Thẻ này bao bọc nội dung của một dòng trong phần nội dung của kết quả được quảng bá. Mỗi dòng nội dung bao gồm một số thẻ BLOCK. Các thẻ này chứa một số văn bản hoặc một đường liên kết có URL và văn bản liên kết.

Thẻ phụ BLOCK*
Thẻ phụ của SL_MAIN
Định dạng nội dung Trống

C
Định nghĩa

Thẻ <C> cho biết rằng dịch vụ WebSearch có thể truy xuất phiên bản được lưu vào bộ nhớ đệm của URL kết quả tìm kiếm này. Bạn không thể truy xuất các trang được lưu vào bộ nhớ đệm thông qua XML API, nhưng bạn có thể chuyển hướng người dùng đến www.google.com cho nội dung này.

Thuộc tính
Tên Định dạng Mô tả
SZ Văn bản (Số nguyên + "k") Cung cấp kích thước của phiên bản được lưu vào bộ nhớ đệm của kết quả tìm kiếm tính bằng kilobyte ("k").
Mã khách hàng Văn bản Xác định một tài liệu trong bộ nhớ đệm của Google. Để tìm nạp tài liệu từ bộ nhớ đệm, hãy gửi một cụm từ tìm kiếm được tạo như sau:
cache:CIDtext:escapedURL

URL đã thoát có trong thẻ UE.

Ví dụ <C SZ="6k" CID="kvOXK_cYSSgJ" />
Thẻ phụ của HAS
Định dạng nội dung Trống

C2C
Định nghĩa Thẻ <C2C> cho biết rằng kết quả đề cập đến một trang bằng tiếng Trung phồn thể. Thẻ này chỉ xuất hiện khi bạn bật chế độ Tìm kiếm bằng tiếng Trung giản thể và tiếng Trung phồn thể. Hãy xem định nghĩa về tham số truy vấn c2coff để biết thêm thông tin về cách bật và tắt tính năng này.
Định dạng nội dung Văn bản

Ngữ cảnh
Định nghĩa

Thẻ <Context> bao gồm một danh sách các nhãn tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm.

Ví dụ <Context>
Thẻ phụ title, Facet+
Định dạng nội dung Vùng chứa

CRAWLDATE
Định nghĩa

Thẻ <CRAWLDATE> xác định ngày mà trang được thu thập dữ liệu lần gần đây nhất. CRAWLDATE không được trả về cho mọi trang kết quả tìm kiếm.

Ví dụ <CRAWLDATE>Ngày 21 tháng 5 năm 2005</CRAWLDATE>
Thẻ phụ của R
Định dạng nội dung Văn bản

DI
Định nghĩa

Thẻ <DI> bao bọc thông tin danh mục của Dự án Thư mục mở (ODP) cho một kết quả tìm kiếm duy nhất.

Ví dụ <DI>
Thẻ phụ DT?, DS?
Thẻ phụ của HAS
Định dạng nội dung Trống

DS
Định nghĩa

Thẻ <DS> cung cấp thông tin tóm tắt được liệt kê cho một danh mục duy nhất trong thư mục ODP.

Ví dụ <DS>Đăng hồ sơ &lt;b&gt;bóng đá&lt;/b&gt; của bạn trực tiếp trên Internet.</DS>
Thẻ phụ của DI
Định dạng nội dung Văn bản (có thể chứa HTML)

DT (cây thiết bị)
Định nghĩa

Thẻ <DT> cung cấp tiêu đề cho một danh mục duy nhất được liệt kê trong thư mục ODP.

Ví dụ <DT>SoccerConnection.net</DT>
Thẻ phụ của DI
Định dạng nội dung Văn bản (có thể chứa HTML)

Thuộc tính
Định nghĩa

Thẻ <Facet> chứa một nhóm logic gồm các thẻ <FacetItem>. Bạn có thể tạo các nhóm này bằng định dạng Thông số kỹ thuật XML của Công cụ tìm kiếm có thể lập trình. Nếu bạn không tạo các nhóm này, thẻ results_xml_tag_Context><Context> sẽ chứa tối đa 4 thẻ <Facet>. Các mục trong mỗi thẻ <Facet> sẽ được nhóm lại cho mục đích hiển thị nhưng có thể không có mối quan hệ logic.

Ví dụ <Facet>
Thẻ phụ FacetItem+, title+
Thẻ phụ của Bối cảnh
Định dạng nội dung Vùng chứa

FacetItem
Định nghĩa

Thẻ <FacetItem> bao gồm thông tin về nhãn tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm.

Ví dụ <FacetItem>
Thẻ phụ label, anchor_text+
Thẻ phụ của Facet
Định dạng nội dung FacetItem

FI
Định nghĩa Thẻ <FI> đóng vai trò là một cờ cho biết liệu quá trình lọc tài liệu có được thực hiện cho nội dung tìm kiếm hay không. Hãy xem phần Tự động lọc trong tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google.
Ví dụ <FI />
Thẻ phụ của RES
Định dạng nội dung Trống

GSP
Định nghĩa

Thẻ <GSP> bao bọc tất cả dữ liệu được trả về trong kết quả tìm kiếm XML của Google. "GSP" là từ viết tắt của "Giao thức Google Tìm kiếm".

Thuộc tính
Tên Định dạng Mô tả
VER Văn bản (Số nguyên) Thuộc tính VER chỉ định phiên bản của đầu ra kết quả tìm kiếm. Phiên bản đầu ra hiện tại là "3.2".
Ví dụ <GSP VER="3.2">
Thẻ phụ PARAM+, Q, RES?, TM
Định dạng nội dung Trống

HAS
Định nghĩa Thẻ <HAS> bao bọc thông tin về mọi tham số yêu cầu tìm kiếm đặc biệt được hỗ trợ cho một URL cụ thể.

Lưu ý: Định nghĩa về <HAS> cho WebSearch có tính hạn chế hơn so với trong DTD.

Thẻ phụ DI?, L? C? RT?
Thẻ phụ của R

ISURL
Định nghĩa Google trả về thẻ <ISURL> nếu cụm từ tìm kiếm được liên kết là một URL.
Thẻ phụ của GSP
Định dạng nội dung Trống

L
Định nghĩa Sự xuất hiện của thẻ <L> cho biết dịch vụ WebSearch có thể tìm thấy những trang web khác liên kết đến URL kết quả tìm kiếm này. Để tìm những trang web như vậy, bạn sẽ sử dụng cụm từ tìm kiếm đặc biệt link:.
Thẻ phụ của HAS
Định dạng nội dung Trống

nhãn
Định nghĩa

Thẻ <label> chỉ định nhãn tinh chỉnh mà bạn có thể dùng để lọc kết quả tìm kiếm nhận được. Để sử dụng nhãn tinh chỉnh, hãy thêm chuỗi more:[[label tag value]] vào giá trị của tham số q trong yêu cầu HTTP của bạn đến Google như minh hoạ trong ví dụ sau. Xin lưu ý rằng bạn phải thoát URL cho giá trị này trước khi gửi truy vấn đến Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

Lưu ý: Thẻ <label> không giống với thẻ <Label>. Thẻ này xác định nhãn tinh chỉnh được liên kết với một URL cụ thể trong kết quả tìm kiếm.

Ví dụ <label>golf_courses</label>
Thẻ phụ của FacetItem
Định dạng nội dung Văn bản

LANG
Định nghĩa

Thẻ <LANG> chứa thông tin dự đoán chính xác nhất của Google về ngôn ngữ của kết quả tìm kiếm.

Ví dụ <LANG>en</LANG>
Thẻ phụ của R
Định dạng nội dung Văn bản

M
Định nghĩa

Thẻ <M> xác định tổng số kết quả ước tính cho lượt tìm kiếm.

Lưu ý: Số liệu ước tính này có thể không chính xác.

Ví dụ <M>16200000</M>
Thẻ phụ của RES
Định dạng nội dung Văn bản

Sơ sinh
Định nghĩa

Thẻ <NB> bao bọc thông tin điều hướng (đường liên kết đến trang kết quả tìm kiếm tiếp theo hoặc trang kết quả tìm kiếm trước đó) cho tập kết quả.

Lưu ý: Thẻ này chỉ xuất hiện nếu có thêm kết quả.

Ví dụ <NB>
Thẻ phụ NU?, PU?
Thẻ phụ của RES
Định dạng nội dung Trống

NU
Định nghĩa

Thẻ <NU> chứa một đường liên kết tương đối đến trang kết quả tìm kiếm tiếp theo.

Ví dụ <NU>/search?q=flowers&num=10&hl=en&ie=UTF-8
    &output=xml&client=test&start=10</NU>
Thẻ phụ của NB
Định dạng nội dung Văn bản (URL tương đối)

PARAM
Định nghĩa

Thẻ <PARAM> xác định một tham số đầu vào được gửi trong yêu cầu HTTP liên kết với kết quả XML. Thông tin về tham số nằm trong các thuộc tính của thẻ – name, value, original_value – và sẽ có một thẻ PARAM cho mỗi tham số được gửi trong yêu cầu HTTP.

Thuộc tính
Tên Định dạng Mô tả
name Văn bản Nhập tên tham số đầu vào.
value HTML Phiên bản có định dạng HTML của giá trị tham số đầu vào.
original_value Văn bản Phiên bản thoát URL ban đầu của giá trị tham số đầu vào.
Ví dụ <PARAM name="cr" value="countryNZ" original_value="countryNZ" />
Thẻ phụ của GSP
Định dạng nội dung Phức tạp

PU
Định nghĩa

Thẻ <PU> cung cấp một đường liên kết tương đối đến trang kết quả tìm kiếm trước đó.

Ví dụ <PU>/search?q=flowers&num=10&hl=en&output=xml
    &client=test&start=10</PU>
Thẻ phụ của NB
Định dạng nội dung Văn bản (URL tương đối)

Hỏi
Định nghĩa

Thẻ <Q> xác định cụm từ tìm kiếm được gửi trong yêu cầu HTTP liên kết với kết quả XML.

Ví dụ

<Q>pizza</Q>

Thẻ phụ của GSP
Định dạng nội dung Văn bản

Điểm
Định nghĩa

Thẻ <R> bao gồm thông tin chi tiết của từng kết quả tìm kiếm.

Lưu ý: Định nghĩa của thẻ <R> cho WebSearch có tính hạn chế hơn so với trong DTD.

Thuộc tính
Tên Định dạng Mô tả
Không Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm này.
MIME Văn bản Cho biết loại MIME của kết quả tìm kiếm.
Thẻ phụ U, UE, T?, CRAWLDATE, S?, LANG?, HAS
Thẻ phụ của RES

RES
Định nghĩa

Thẻ <RES> bao gồm tập hợp các kết quả tìm kiếm riêng lẻ và thông tin chi tiết về những kết quả đó.

Thuộc tính
Tên Định dạng Mô tả
SN (Senegal) Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm đầu tiên được trả về trong tập kết quả này.
EN Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm cuối cùng được trả về trong tập hợp kết quả này.
Ví dụ <RES SN="1" EN="10">
Thẻ phụ M, FI?, XT?, NB?, R*
Thẻ phụ của GSP
Định dạng nội dung Trống

N
Định nghĩa

Thẻ <S> chứa một đoạn trích cho kết quả tìm kiếm, trong đó các cụm từ tìm kiếm được đánh dấu bằng chữ in đậm. Dấu ngắt dòng được đưa vào đoạn trích để văn bản được xuống dòng đúng cách.

Ví dụ <S>Washington (CNN) – Một nỗ lực nhằm chấm dứt tình trạng bế tắc tại Thượng viện về các đề cử tư pháp của Tổng thống &lt;b&gt;Bush&#39;s&lt;/b&gt; sẽ cho phép 5 người được đề cử tiến hành bỏ phiếu cuối cùng trong khi vẫn duy trì &lt;b&gt;...&lt;b&gt;...&lt;/b&gt;<S>
Thẻ phụ của R
Định dạng nội dung Văn bản (HTML)

SL_MAIN
Định nghĩa

Thẻ này bao bọc nội dung của một kết quả khuyến mãi. Sử dụng để phân tích cú pháp chương trình khuyến mãi. Văn bản liên kết và URL của đường liên kết tiêu đề nằm trong thẻ phụ TU tương ứng. Các dòng văn bản nội dung và đường liên kết nằm trong thẻ phụ BODY_LINE.

Thẻ phụ BODY_LINE*, T, U
Thẻ phụ của SL_RESULTS
Định dạng nội dung Trống

SL_RESULTS
Định nghĩa

Thẻ trong trình chứa cho kết quả được quảng bá. Một trong những biểu tượng này sẽ xuất hiện bất cứ khi nào bạn có chương trình khuyến mãi trong kết quả tìm kiếm. Thẻ phụ SL_MAIN chứa dữ liệu kết quả chính.

Thẻ phụ SL_MAIN*
Thẻ phụ của R
Định dạng nội dung Trống

Chính tả
Định nghĩa

Thẻ <Spelling> bao gồm một gợi ý chính tả thay thế cho cụm từ tìm kiếm đã gửi. Thẻ này chỉ xuất hiện trên trang đầu tiên của kết quả tìm kiếm. Tính năng gợi ý chính tả hiện hỗ trợ tiếng Anh, tiếng Trung, tiếng Nhật và tiếng Hàn.

Lưu ý: Google sẽ chỉ trả về đề xuất chính tả cho những cụm từ tìm kiếm có giá trị tham số gl bằng chữ thường.

Ví dụ <Spelling>
Thẻ phụ Đề xuất
Thẻ phụ của GSP
Định dạng nội dung Trống

Đề xuất
Định nghĩa Thẻ <Suggestion> chứa một gợi ý chính tả thay thế cho truy vấn đã gửi. Bạn có thể dùng nội dung của thẻ này để đề xuất gợi ý chính tả thay thế cho người dùng tìm kiếm. Giá trị của thuộc tính q là gợi ý chính tả được thoát URL mà bạn có thể dùng làm cụm từ tìm kiếm.
Thuộc tính
Tên Định dạng Nội dung mô tả
q Văn bản Thuộc tính q chỉ định phiên bản thoát URL của gợi ý chính tả.
Ví dụ <Suggestion q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Suggestion>
Thẻ phụ của Chính tả
Định dạng nội dung Văn bản (HTML)

T
Định nghĩa Thẻ <T> chứa tiêu đề của kết quả.
Ví dụ <T>Amici's East Coast Pizzeria</T>
Thẻ phụ của R
Định dạng nội dung Văn bản (HTML)

tiêu đề
Định nghĩa

Là thẻ con của <Context>, thẻ <title> chứa tên của Công cụ tìm kiếm có thể lập trình.

Là thẻ con của <Facet>, thẻ <title> cung cấp tiêu đề cho một nhóm khía cạnh.

Ví dụ

Là phần tử con của <Context>: <title>Công cụ tìm kiếm của tôi</title>

Là thành phần con của <Facet>: <title>facet title</title>

Thẻ phụ của Context (Ngữ cảnh), Facet (Khía cạnh)
Định dạng nội dung Văn bản

TM
Định nghĩa

Thẻ <TM> xác định tổng thời gian máy chủ cần thiết để trả về kết quả tìm kiếm, được đo bằng giây.

Ví dụ <TM>0.100445</TM>
Thẻ phụ của GSP
Định dạng nội dung Văn bản (Số dấu phẩy động)

TT
Định nghĩa Thẻ <TT> cung cấp một mẹo tìm kiếm.
Ví dụ <TT>&lt;i&gt;Lưu ý: Đối với hầu hết các trình duyệt, việc nhấn phím Return sẽ cho ra kết quả tương tự như khi bạn nhấp vào nút Tìm kiếm.&lt;/i&gt;</TT>
Thẻ phụ của GSP

U
Định nghĩa Thẻ <U> cung cấp URL của kết quả tìm kiếm.
Ví dụ <U>http://www.dominos.com/</U>
Thẻ phụ của R
Định dạng nội dung Văn bản (URL tuyệt đối)

UD
Định nghĩa

Thẻ <UD> cung cấp URL được mã hoá IDN (Tên miền quốc tế) cho kết quả tìm kiếm. Giá trị này cho phép hiển thị các miền bằng ngôn ngữ địa phương. Ví dụ: URL được mã hoá IDN http://www.%E8%8A%B1%E4%BA%95.com có thể được giải mã và hiển thị dưới dạng http://www.花井鮨.com. Thẻ <UD> này sẽ chỉ được đưa vào kết quả tìm kiếm cho những yêu cầu có tham số ud.

Lưu ý: Đây là một tính năng thử nghiệm.

Ví dụ <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
Thẻ phụ của R
Định dạng nội dung Văn bản (URL được mã hoá IDN)

UE
Định nghĩa Thẻ <UE> cung cấp URL của kết quả tìm kiếm. Giá trị này được thoát URL để phù hợp với việc truyền dưới dạng tham số truy vấn trong URL.
Ví dụ <UE>http://www.dominos.com/</UE>
Thẻ phụ của R
Định dạng nội dung Văn bản (URL đã thoát)

XT
Định nghĩa Thẻ <XT> cho biết tổng số kết quả ước tính (do thẻ M chỉ định) thực sự là tổng số kết quả chính xác. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin chi tiết.
Ví dụ <XT />
Thẻ phụ của RES
Định dạng nội dung Trống


Kết quả XML cho các cụm từ tìm kiếm hình ảnh

Yêu cầu này về Hình ảnh yêu cầu 5 kết quả (num=5) về cụm từ tìm kiếm "monkey" (q=monkey).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Yêu cầu này sẽ cho ra kết quả XML bên dưới.

<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

Tìm kiếm hình ảnh: Thẻ XML

Bảng dưới đây cho thấy các thẻ XML bổ sung được dùng trong phản hồi XML cho cụm từ tìm kiếm hình ảnh.

Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:

? = thẻ phụ không bắt buộc
* = không hoặc nhiều phiên bản của thẻ phụ
+ = một hoặc nhiều phiên bản của thẻ phụ

RG
Định nghĩa

Thẻ <RG> bao gồm thông tin chi tiết về từng kết quả tìm kiếm hình ảnh.

Thuộc tính
Tên Định dạng Mô tả
Không Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm này.
MIME Văn bản Cho biết loại MIME của kết quả tìm kiếm.
Thẻ phụ của RES
RU (Nga)
Định nghĩa

Thẻ <RU tag> bao gồm thông tin chi tiết của từng kết quả tìm kiếm hình ảnh.

Thẻ phụ của R