Trang này đề cập đến phiên bản XML của Custom Search JSON API. Phiên bản này chỉ dành cho khách hàng sử dụng Tìm kiếm trên trang web của Google.
- Tổng quan
- Định dạng yêu cầu của Công cụ tìm kiếm có thể lập trình
- Kết quả XML
Tổng quan
Dịch vụ Google WebSearch cho phép khách hàng của Google Site Search hiển thị kết quả tìm kiếm trên Google trên trang web của riêng họ. Dịch vụ WebSearch sử dụng một giao thức đơn giản dựa trên HTTP để phân phát kết quả tìm kiếm. Quản trị viên tìm kiếm có toàn quyền kiểm soát cách họ yêu cầu kết quả tìm kiếm và cách họ trình bày những kết quả đó cho người dùng cuối. Tài liệu này mô tả chi tiết về kỹ thuật của định dạng yêu cầu và kết quả tìm kiếm của Google.
Để truy xuất kết quả từ Google Tìm kiếm trên web, ứng dụng của bạn sẽ gửi cho Google một yêu cầu HTTP đơn giản. Sau đó, Google sẽ trả về kết quả tìm kiếm ở định dạng XML. Kết quả được định dạng XML cho phép bạn tuỳ chỉnh cách kết quả tìm kiếm hiển thị.
Định dạng yêu cầu WebSearch
- Tổng quan về yêu cầu
- Cụm từ tìm kiếm
- Tham số của yêu cầu
- Truy vấn mẫu cho WebSearch
- Định nghĩa tham số truy vấn WebSearch
- Cụm từ tìm kiếm hình ảnh mẫu
- Định nghĩa tham số truy vấn tìm kiếm hình ảnh
- Tìm kiếm nâng cao
- Tham số truy vấn Tìm kiếm nâng cao
- Điều khoản đặc biệt về cụm từ tìm kiếm
- Giới hạn yêu cầu
Tổng quan về yêu cầu
Yêu cầu tìm kiếm của Google là một lệnh HTTP GET tiêu chuẩn. Nó bao gồm một tập hợp các tham số liên quan đến truy vấn của bạn. Các tham số này được đưa vào URL yêu cầu dưới dạng các cặp name=value được phân tách bằng ký tự dấu và (&). Các tham số bao gồm dữ liệu như cụm từ tìm kiếm và mã nhận dạng riêng biệt của công cụ (cx) để xác định công cụ đang đưa ra yêu cầu HTTP. Dịch vụ WebSearch hoặc Tìm kiếm hình ảnh trả về kết quả XML để phản hồi các yêu cầu HTTP của bạn.
Cụm từ tìm kiếm
Hầu hết các yêu cầu tìm kiếm đều có một hoặc nhiều cụm từ tìm kiếm. Cụm từ tìm kiếm xuất hiện dưới dạng giá trị của một tham số trong yêu cầu tìm kiếm.
Cụm từ tìm kiếm có thể chỉ định một số loại thông tin để lọc và sắp xếp kết quả tìm kiếm mà Google trả về. Cụm từ tìm kiếm có thể chỉ định:
- Từ hoặc cụm từ cần thêm hoặc loại trừ
- Tất cả các từ trong cụm từ tìm kiếm (mặc định)
- Một cụm từ chính xác trong cụm từ tìm kiếm
- Bất kỳ từ hoặc cụm từ nào trong cụm từ tìm kiếm
- Vị trí trong tài liệu để tìm cụm từ tìm kiếm
- Mọi nơi trong tài liệu (mặc định)
- Chỉ trong các đường liên kết trong tài liệu
- Các quy định hạn chế đối với chính tài liệu
- Bao gồm hoặc loại trừ tài liệu thuộc một số loại tệp cụ thể (chẳng hạn như tệp PDF hoặc tài liệu Word)
- Cụm từ tìm kiếm đặc biệt trong URL trả về thông tin về một URL nhất định, thay vì thực hiện một cụm từ tìm kiếm
- Các truy vấn trả về thông tin chung về một URL, chẳng hạn như danh mục, đoạn trích hoặc ngôn ngữ của URL đó trên Open Directory
- Các truy vấn trả về tập hợp các trang web liên kết đến một URL
- Các truy vấn trả về một tập hợp các trang web tương tự như một URL nhất định
Tìm kiếm mặc định
Giá trị tham số truy vấn tìm kiếm phải được thoát URL. Xin lưu ý rằng bạn sẽ thay thế dấu cộng ("+") cho mọi chuỗi khoảng trắng trong cụm từ tìm kiếm. Vấn đề này sẽ được thảo luận thêm trong phần Thoát URL của tài liệu này.
Cụm từ tìm kiếm được gửi đến dịch vụ WebSearch bằng tham số q. Một cụm từ tìm kiếm mẫu là:
q=horses+cows+pigs
Theo mặc định, dịch vụ Google WebSearch chỉ trả về những tài liệu có chứa tất cả các cụm từ trong cụm từ tìm kiếm.
Tham số yêu cầu
Phần này liệt kê các tham số mà bạn có thể sử dụng khi đưa ra yêu cầu tìm kiếm. Các tham số được chia thành hai danh sách. Danh sách đầu tiên chứa các tham số liên quan đến tất cả các yêu cầu tìm kiếm. Danh sách thứ hai chứa các tham số chỉ liên quan đến yêu cầu tìm kiếm nâng cao.
Bạn phải có 3 tham số yêu cầu:
- Bạn phải đặt tham số client thành
google-csbe - Tham số output chỉ định định dạng của kết quả XML được trả về; kết quả có thể được trả về có (xml) hoặc không có (
xml_no_dtd) nội dung tham chiếu đến DTD của Google. Bạn nên đặt giá trị này thànhxml_no_dtd. Lưu ý: Nếu bạn không chỉ định tham số này, thì kết quả sẽ được trả về ở định dạng HTML thay vì XML.
- Tham số cx đại diện cho mã nhận dạng duy nhất của công cụ.
Các tham số yêu cầu thường dùng nhất ngoài những tham số đã đề cập ở trên là:
- num – số lượng kết quả tìm kiếm được yêu cầu
- q – (các) cụm từ tìm kiếm
- start – chỉ mục bắt đầu cho kết quả
Truy vấn mẫu trên WebSearch
Các ví dụ bên dưới cho thấy một vài yêu cầu HTTP WebSearch để minh hoạ cách sử dụng các tham số truy vấn khác nhau. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn WebSearch và phần Tham số truy vấn tìm kiếm nâng cao của tài liệu này.
Yêu cầu này yêu cầu 10 kết quả đầu tiên (start=0&num=10) cho cụm từ tìm kiếm "red sox" (q=red+sox). Truy vấn này cũng chỉ định rằng kết quả phải đến từ các trang web của Canada (cr=countryCA) và phải được viết bằng tiếng Pháp (lr=lang_fr). Cuối cùng, truy vấn này chỉ định các giá trị cho các tham số client, output và cx, cả ba tham số này đều bắt buộc.
http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
Ví dụ này sử dụng một số tham số truy vấn tìm kiếm nâng cao để tuỳ chỉnh thêm truy vấn tìm kiếm. Yêu cầu này sử dụng tham số as_q (as_q=red+sox) thay vì tham số q. Lệnh này cũng sử dụng tham số as_eq để loại trừ mọi tài liệu có chứa từ "Yankees" khỏi kết quả tìm kiếm (as_eq=yankees).
http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
Định nghĩa về tham số truy vấn WebSearch
| c2coff | |||||||
|---|---|---|---|---|---|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số c2coff cho phép bật hoặc tắt tính năng Tìm kiếm bằng tiếng Trung giản thể và tiếng Trung phồn thể. Giá trị mặc định của tham số này là
|
||||||
| Ví dụ | q=google&c2coff=1 |
||||||
| khách hàng | |
|---|---|
| Nội dung mô tả | Bắt buộc. Bạn phải đặt tham số |
| Ví dụ | q=google&client=google-csbe |
| cr | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:
Hãy xem phần Giá trị tham số Quốc gia (cr) để biết danh sách các giá trị hợp lệ cho tham số này. |
| Ví dụ | q=Frodo&cr=countryNZ |
| cx | |
|---|---|
| Nội dung mô tả | Bắt buộc. Tham số |
| Ví dụ | q=Frodo&cx=00255077836266642015:u-scht7a-8i |
| filter | |||||||
|---|---|---|---|---|---|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số filter sẽ kích hoạt hoặc huỷ kích hoạt tính năng tự động lọc kết quả tìm kiếm trên Google. Hãy xem phần Lọc tự động trong tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google. Giá trị mặc định cho tham số
Lưu ý: Theo mặc định, Google áp dụng bộ lọc cho tất cả kết quả tìm kiếm để cải thiện chất lượng của những kết quả đó. |
||||||
| Ví dụ | q=google&filter=0 |
||||||
| gl | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Giá trị tham số Việc chỉ định giá trị tham số |
| Ví dụ | Yêu cầu này giúp tăng thứ hạng cho các tài liệu được viết ở Vương quốc Anh trong kết quả WebSearch: |
| hl | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Hãy xem phần Ngôn ngữ giao diện trong phần Quốc tế hoá các cụm từ tìm kiếm và cách trình bày kết quả để biết thêm thông tin và Ngôn ngữ giao diện được hỗ trợ để xem danh sách các ngôn ngữ được hỗ trợ. |
| Ví dụ | Yêu cầu này nhắm đến quảng cáo về rượu vang bằng tiếng Pháp. (Vin là thuật ngữ tiếng Pháp cho rượu vang.) q=vin&ip=10.10.10.10&ad=w5&hl=fr |
| hq | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ | Yêu cầu này tìm kiếm "pizza" VÀ "phô mai". Biểu thức này giống với
|
| ie | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Hãy xem phần Mã hoá ký tự để biết thông tin thảo luận về thời điểm bạn có thể cần sử dụng tham số này. Hãy xem phần Các lược đồ mã hoá ký tự để biết danh sách các giá trị |
| Ví dụ | q=google&ie=utf8&oe=utf8 |
| lr | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:
Hãy xem phần Giá trị tập hợp ngôn ngữ ( |
| Ví dụ | q=Frodo&lr=lang_en |
| num | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Giá trị Lưu ý: Nếu tổng số kết quả tìm kiếm ít hơn số kết quả được yêu cầu, thì tất cả kết quả tìm kiếm có sẵn sẽ được trả về. |
| Ví dụ | q=google&num=10 |
| oe | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Hãy xem phần Mã hoá ký tự để biết thông tin thảo luận về thời điểm bạn có thể cần sử dụng tham số này. Hãy xem phần Các lược đồ mã hoá ký tự để biết danh sách các giá trị |
| Ví dụ | q=google&ie=utf8&oe=utf8 |
| output | |||||||
|---|---|---|---|---|---|---|---|
| Nội dung mô tả | Bắt buộc. Tham số
|
||||||
| Ví dụ | output=xml_no_dtd |
||||||
| q | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Ngoài ra, có một số cụm từ tìm kiếm đặc biệt có thể được dùng làm một phần của giá trị tham số Bảng điều khiển Google Tìm kiếm có một báo cáo về những cụm từ tìm kiếm hàng đầu được gửi bằng tham số Lưu ý: Giá trị được chỉ định cho tham số q phải được thoát URL. |
| Ví dụ | q=vacation&as_oq=london+paris |
| an toàn | |||||||||
|---|---|---|---|---|---|---|---|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số
Hãy xem phần Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn để biết thêm thông tin chi tiết về tính năng này. |
||||||||
| Ví dụ | q=adult&safe=high |
||||||||
| start | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số Tham số |
| Ví dụ | start=10 |
| sắp xếp | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ |
|
| ud | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số http://www.花井鮨.com Các giá trị hợp lệ cho tham số này là Nếu tham số http://www.xn--elq438j.com. Lưu ý: Đây là một tính năng thử nghiệm. |
| Ví dụ | q=google&ud=1 |
Tìm kiếm nâng cao
Các tham số truy vấn bổ sung được liệt kê bên dưới hình ảnh có liên quan đến cụm từ tìm kiếm nâng cao. Khi bạn gửi một cụm từ tìm kiếm nâng cao, các giá trị của một số tham số (ví dụ: as_eq, as_epq, as_oq, v.v.) đều được đưa vào cụm từ tìm kiếm cho cụm từ tìm kiếm đó. Hình ảnh này cho thấy trang Tìm kiếm nâng cao của Google. Trên hình ảnh, tên của từng tham số tìm kiếm nâng cao được viết bằng văn bản màu đỏ bên trong hoặc bên cạnh trường trên trang mà tham số đó tương ứng.
Tham số truy vấn tìm kiếm nâng cao
| as_dt | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ | as_dt=i,as_dt=e |
| as_epq | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ | as_epq=abraham+lincoln |
| as_eq | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ |
|
| as_lq | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ |
|
| as_nlo | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ | Sau đây đặt phạm vi tìm kiếm từ 5 đến 10, bao gồm cả 5 và 10:
|
| as_nhi | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ | Sau đây đặt phạm vi tìm kiếm từ 5 đến 10, bao gồm cả 5 và 10:
|
| as_oq | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ |
|
| as_q | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ |
|
| as_qdr | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số
|
| Ví dụ |
Ví dụ này yêu cầu kết quả trong năm vừa qua:
Ví dụ này yêu cầu kết quả trong 10 ngày qua:
|
| as_sitesearch | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Tham số |
| Ví dụ |
|
Cụm từ tìm kiếm đặc biệt
Google WebSearch cho phép sử dụng một số cụm từ tìm kiếm đặc biệt để truy cập vào các chức năng bổ sung của công cụ tìm kiếm của Google. Bạn nên đưa các cụm từ tìm kiếm đặc biệt này vào giá trị của tham số yêu cầu q. Giống như các cụm từ tìm kiếm khác, các cụm từ tìm kiếm đặc biệt phải được thoát URL. Một số cụm từ tìm kiếm đặc biệt có chứa dấu hai chấm (:). Ký tự này cũng phải được chuyển đổi ký tự URL; giá trị được chuyển đổi ký tự URL của ký tự này là %3A.
| Đường liên kết ngược [link:] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm Phiên bản có ký tự thoát URL của Bạn cũng có thể sử dụng tham số yêu cầu as_lq để gửi yêu cầu Lưu ý: Bạn không thể chỉ định bất kỳ cụm từ tìm kiếm nào khác khi sử dụng |
| Ví dụ |
|
| Tìm kiếm bằng toán tử OR (hoặc) [ OR ] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm Bạn cũng có thể sử dụng tham số yêu cầu as_oq để gửi yêu cầu tìm kiếm cho bất kỳ cụm từ nào trong một tập hợp cụm từ. Lưu ý: Nếu một yêu cầu tìm kiếm chỉ định cụm từ tìm kiếm "London+OR+Paris", thì kết quả tìm kiếm sẽ bao gồm những tài liệu chứa ít nhất một trong hai từ đó. Trong một số trường hợp, tài liệu trong kết quả tìm kiếm có thể chứa cả hai từ. |
| Ví dụ | Tìm kiếm London hoặc Paris: Hoạt động đầu vào của người dùng:
london OR
paris Cụm từ tìm kiếm:q=london+OR+parisTìm kiếm kỳ nghỉ và London hoặc Paris: Cụm từ tìm kiếm:
q=vacation+london+OR+parisTìm kiếm kỳ nghỉ và một trong các từ khoá London, Paris hoặc sô cô la: Cụm từ tìm kiếm:
q=vacation+london+OR+paris+OR+chocolatesTìm kiếm kỳ nghỉ và sô cô la, cũng như london hoặc paris, trong đó sô cô la được gán trọng số thấp nhất: Cụm từ tìm kiếm:
q=vacation+london+OR+paris+chocolatesTìm thông tin về kỳ nghỉ, sô cô la và hoa trong những tài liệu cũng có chứa London hoặc Paris: Cụm từ tìm kiếm:
q=vacation+london+OR+paris+chocolates+flowersTìm kiếm kỳ nghỉ và một trong hai địa điểm London hoặc Paris, đồng thời tìm kiếm một trong hai sản phẩm sô cô la hoặc hoa: Cụm từ tìm kiếm: q=vacation+london+OR+paris+chocolates+OR+flowers |
| Loại trừ cụm từ tìm kiếm [-] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm loại trừ ( Phiên bản có ký tự thoát URL của Cụm từ tìm kiếm loại trừ sẽ hữu ích khi một cụm từ tìm kiếm có nhiều nghĩa. Ví dụ: từ "bass" có thể trả về kết quả về cá hoặc nhạc. Nếu đang tìm tài liệu về cá, bạn có thể loại trừ tài liệu về nhạc khỏi kết quả tìm kiếm bằng cách sử dụng cụm từ tìm kiếm loại trừ. Bạn cũng có thể sử dụng tham số yêu cầu as_eq để loại trừ những tài liệu có chứa một từ hoặc cụm từ cụ thể khỏi kết quả tìm kiếm. |
| Ví dụ | Hoạt động đầu vào của người dùng: bass -musicCụm từ tìm kiếm: q=bass+%2Dmusic |
| Loại trừ loại tệp [ -filetype: ] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm Phiên bản có ký tự thoát URL của Lưu ý: Bạn có thể loại trừ nhiều loại tệp khỏi kết quả tìm kiếm bằng cách thêm nhiều cụm từ tìm kiếm Các loại tệp mà Google hỗ trợ bao gồm:
Sau này, chúng tôi có thể thêm các loại tệp khác. Bạn luôn có thể xem danh sách mới nhất trong câu hỏi thường gặp về loại tệp của Google. |
| Ví dụ | Ví dụ này trả về những tài liệu đề cập đến "Google" nhưng không phải là tài liệu PDF: Ví dụ này trả về những tài liệu đề cập đến "Google" nhưng loại trừ cả tài liệu PDF và Word: |
| Lọc theo loại tệp [ filetype: ] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm Phiên bản có ký tự thoát URL của Bạn có thể giới hạn kết quả tìm kiếm ở những tài liệu khớp với một trong số các đuôi tệp bằng cách thêm nhiều cụm từ tìm kiếm Theo mặc định, kết quả tìm kiếm sẽ bao gồm các tài liệu có đuôi tệp bất kỳ. Các loại tệp mà Google hỗ trợ bao gồm:
Sau này, chúng tôi có thể thêm các loại tệp khác. Bạn luôn có thể xem danh sách mới nhất trong câu hỏi thường gặp về loại tệp của Google. |
| Ví dụ | Ví dụ này trả về các tài liệu PDF có đề cập đến "Google": Ví dụ này trả về các tài liệu PDF và Word có đề cập đến "Google": |
| Bao gồm cụm từ tìm kiếm [+] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm bao gồm (+) chỉ định rằng một từ hoặc cụm từ phải xuất hiện trong tất cả các tài liệu có trong kết quả tìm kiếm. Để sử dụng cụm từ tìm kiếm bao gồm, bạn sẽ đặt "+" (dấu cộng) trước từ hoặc cụm từ phải có trong tất cả kết quả tìm kiếm. Phiên bản thoát URL của Bạn nên sử dụng |
| Ví dụ | Hoạt động đầu vào của người dùng: Star Wars Episode +ICụm từ tìm kiếm: q=Star+Wars+Episode+%2BI |
| Chỉ tìm đường liên kết, tất cả các cụm từ [ allinlinks: ] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm Nếu cụm từ tìm kiếm của bạn có chứa cụm từ tìm kiếm Phiên bản có ký tự thoát URL của |
| Ví dụ | Hoạt động đầu vào của người dùng:allinlinks: Google searchCụm từ tìm kiếm: q=allinlinks%3A+Google+search |
| Tìm kiếm cụm từ | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm (") cho phép bạn tìm kiếm các cụm từ hoàn chỉnh bằng cách đặt cụm từ trong dấu ngoặc kép hoặc bằng cách kết nối các cụm từ đó bằng dấu gạch ngang. Phiên bản có ký tự thoát của Cụm từ tìm kiếm đặc biệt hữu ích nếu bạn đang tìm kiếm các câu trích dẫn nổi tiếng hoặc tên riêng. Bạn cũng có thể sử dụng tham số yêu cầu as_epq để gửi một cụm từ tìm kiếm. |
| Ví dụ | Hoạt động đầu vào của người dùng:"Abraham Lincoln"Cụm từ tìm kiếm: q=%22Abraham+Lincoln%22 |
| Thông tin về tài liệu trên web [info:] | |
|---|---|
| Nội dung mô tả | Cụm từ tìm kiếm Phiên bản thoát URL của Lưu ý: Bạn không thể chỉ định bất kỳ cụm từ tìm kiếm nào khác khi sử dụng |
| Ví dụ | Hoạt động đầu vào của người dùng: info:www.google.comCụm từ tìm kiếm: q=info%3Awww.google.com |
Cụm từ tìm kiếm mẫu cho hình ảnh
Các ví dụ bên dưới cho thấy một vài yêu cầu HTTP về hình ảnh để minh hoạ cách sử dụng các tham số truy vấn khác nhau. Định nghĩa về các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa về tham số truy vấn hình ảnh của tài liệu này.
Yêu cầu này yêu cầu 5 kết quả đầu tiên (start=0&num=5) cho cụm từ tìm kiếm "monkey" (q=monkey), thuộc loại tệp .png. Cuối cùng, truy vấn chỉ định các giá trị cho tham số client, output và cx. Cả 3 tham số này đều là bắt buộc.
http://www.google.com/cse? searchtype=image start=0 &num=5 &q=monkey &as_filetype=png &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
Tham số truy vấn tìm kiếm hình ảnh
| as_filetype | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Trả về hình ảnh thuộc một loại cụ thể. Các giá trị được phép là: |
| Ví dụ | q=google&as_filetype=png |
| imgsz | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Trả về hình ảnh có kích thước được chỉ định, trong đó kích thước có thể là một trong những kích thước sau:
|
| Ví dụ | q=google&as_filetype=png&imgsz=icon |
| imgtype | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Trả về hình ảnh thuộc một loại, có thể là một trong những loại sau:
|
| Ví dụ | q=google&as_filetype=png&imgtype=photo |
| imgc | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Trả về hình ảnh đen trắng, thang độ xám hoặc hình ảnh có màu:
|
| Ví dụ | q=google&as_filetype=png&imgc=gray |
| imgcolor | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Trả về hình ảnh có một màu chủ đạo cụ thể:
|
| Ví dụ | q=google&as_filetype=png&imgcolor=yellow |
| as_rights | |
|---|---|
| Nội dung mô tả | Không bắt buộc. Bộ lọc dựa trên việc cấp phép. Các giá trị được hỗ trợ bao gồm:
|
| Ví dụ | q=cats&as_filetype=png&as_rights=cc_attribute |
Giới hạn yêu cầu
Biểu đồ dưới đây liệt kê các giới hạn đối với những yêu cầu tìm kiếm mà bạn gửi đến Google:
| Thành phần | Hạn mức | Bình luận |
|---|---|---|
| Độ dài yêu cầu tìm kiếm | 2048 byte | |
| Số lượng cụm từ tìm kiếm | 10 | bao gồm các cụm từ trong những tham số sau: q, as_epq, as_eq, as_lq, as_oq, as_q |
| Số kết quả | 20 | Nếu đặt tham số num thành một số lớn hơn 20, thì chỉ có 20 kết quả được trả về. Để nhận thêm kết quả, bạn cần gửi nhiều yêu cầu và tăng giá trị của tham số start theo từng yêu cầu. |
Quốc tế hoá truy vấn và cách trình bày kết quả
Dịch vụ Google WebSearch cho phép bạn tìm kiếm tài liệu bằng nhiều ngôn ngữ. Bạn có thể chỉ định phương thức mã hoá ký tự sẽ được dùng để diễn giải yêu cầu HTTP và mã hoá phản hồi XML (bằng cách sử dụng các tham số tìm kiếm ie và oe). Bạn cũng có thể lọc kết quả để chỉ bao gồm những tài liệu được viết bằng một số ngôn ngữ nhất định.
Các phần sau đây thảo luận về những vấn đề liên quan đến việc tìm kiếm bằng nhiều ngôn ngữ:
Mã hoá ký tự
Các máy chủ gửi dữ liệu (chẳng hạn như trang web) đến các tác nhân người dùng (chẳng hạn như trình duyệt) dưới dạng một chuỗi gồm các byte được mã hoá. Sau đó, tác nhân người dùng sẽ giải mã các byte thành một chuỗi ký tự. Khi gửi yêu cầu đến dịch vụ WebSearch, bạn có thể chỉ định các lược đồ mã hoá cho cả cụm từ tìm kiếm và phản hồi XML mà bạn nhận được.
Bạn có thể sử dụng tham số yêu cầu ie để chỉ định cơ chế mã hoá cho các ký tự trong yêu cầu HTTP. Bạn cũng có thể sử dụng tham số oe để chỉ định lược đồ mã hoá mà Google sẽ dùng để mã hoá phản hồi XML của bạn. Nếu bạn đang sử dụng một sơ đồ mã hoá khác ngoài ISO-8859-1 (hoặc latin1), vui lòng đảm bảo rằng bạn chỉ định đúng giá trị cho các tham số ie và oe.
Lưu ý: Nếu đang cung cấp chức năng tìm kiếm cho nhiều ngôn ngữ, bạn nên sử dụng giá trị mã hoá utf8 (UTF-8) cho cả tham số ie và oe.
Vui lòng tham khảo phụ lục Các lược đồ mã hoá ký tự để xem danh sách đầy đủ các giá trị mà bạn có thể dùng cho các tham số ie và oe.
Để biết thêm thông tin chung về cách mã hoá ký tự, vui lòng xem tại http://www.w3.org/TR/REC-html40/charset.html.
Ngôn ngữ giao diện
Bạn có thể sử dụng tham số yêu cầu hl để xác định ngôn ngữ của giao diện đồ hoạ. Giá trị tham số hl có thể ảnh hưởng đến kết quả tìm kiếm XML, đặc biệt là đối với các cụm từ tìm kiếm quốc tế khi bạn không chỉ định rõ ràng chế độ hạn chế ngôn ngữ (bằng cách sử dụng tham số lr). Trong những trường hợp như vậy, tham số hl có thể thúc đẩy kết quả tìm kiếm bằng cùng ngôn ngữ với ngôn ngữ đầu vào của người dùng.
Bạn nên đặt rõ ràng tham số hl trong kết quả tìm kiếm để đảm bảo Google chọn kết quả tìm kiếm có chất lượng cao nhất cho mỗi cụm từ tìm kiếm.
Vui lòng xem phần Ngôn ngữ giao diện được hỗ trợ để biết danh sách đầy đủ các giá trị hợp lệ cho tham số hl.
Tìm kiếm tài liệu được viết bằng một số ngôn ngữ cụ thể
Bạn có thể sử dụng thông số yêu cầu lr để hạn chế kết quả tìm kiếm đối với những tài liệu được viết bằng một ngôn ngữ hoặc một nhóm ngôn ngữ cụ thể.
Tham số lr hỗ trợ Toán tử Boolean để cho phép bạn chỉ định nhiều ngôn ngữ cần được đưa vào (hoặc loại trừ) khỏi kết quả tìm kiếm.
Các ví dụ sau đây cho thấy cách bạn có thể sử dụng Toán tử Boolean để yêu cầu tài liệu bằng nhiều ngôn ngữ.
Đối với tài liệu viết bằng tiếng Nhật:
lr=lang_jp
Đối với tài liệu được viết bằng tiếng Ý hoặc tiếng Đức:
lr=lang_it|lang_de
Đối với những tài liệu không được viết bằng tiếng Hungary hoặc tiếng Séc:
lr=(-lang_hu).(-lang_cs)
Vui lòng xem phần Giá trị tập hợp ngôn ngữ để biết danh sách đầy đủ các giá trị có thể có cho tham số lr và phần Toán tử Boolean để biết nội dung thảo luận đầy đủ về việc sử dụng các toán tử này.
Tìm kiếm bằng tiếng Trung giản thể và phồn thể
Tiếng Trung giản thể và tiếng Trung phồn thể là hai biến thể chữ viết của tiếng Trung. Cùng một khái niệm có thể được viết theo cách khác nhau trong mỗi biến thể. Với một truy vấn trong một trong các biến thể, dịch vụ Google WebSearch có thể trả về kết quả bao gồm các trang ở cả hai biến thể.
Cách dùng tính năng này:
- Đặt tham số yêu cầu c2coff thành 0
và - Thực hiện một trong các hành động sau:
Ví dụ sau đây cho thấy các tham số truy vấn mà bạn sẽ đưa vào yêu cầu để nhận kết quả bằng cả tiếng Trung giản thể và tiếng Trung phồn thể. (Xin lưu ý rằng thông tin bắt buộc bổ sung, chẳng hạn như máy khách, không có trong ví dụ này.)
search?hl=zh-CN
&lr=lang_zh-TW|lang_zh-CN
&c2coff=0Lọc kết quả
Google Tìm kiếm trên web cung cấp một số cách để lọc kết quả tìm kiếm:
- Tự động lọc kết quả tìm kiếm
- Lọc theo ngôn ngữ và quốc gia
- Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
Tự động lọc kết quả tìm kiếm
Nhằm cung cấp kết quả tìm kiếm phù hợp nhất có thể, Google sử dụng 2 kỹ thuật để tự động lọc ra những kết quả tìm kiếm thường bị coi là không mong muốn:
-
Nội dung trùng lặp – Nếu nhiều tài liệu chứa cùng một thông tin, thì chỉ tài liệu có liên quan nhất trong nhóm đó mới được đưa vào kết quả tìm kiếm của bạn.
-
Lọc kết quả tìm kiếm không mong muốn – Nếu có nhiều kết quả tìm kiếm từ cùng một trang web, thì Google có thể không hiển thị tất cả kết quả từ trang web đó hoặc có thể hiển thị kết quả ở thứ hạng thấp hơn
so với thứ hạng lẽ ra kết quả đó có được.
Bạn nên bật các bộ lọc này cho các yêu cầu tìm kiếm thông thường vì các bộ lọc này giúp nâng cao đáng kể chất lượng của hầu hết kết quả tìm kiếm. Tuy nhiên, bạn có thể bỏ qua các bộ lọc tự động này bằng cách đặt tham số truy vấn filter thành 0 trong yêu cầu tìm kiếm.
Lọc theo ngôn ngữ và quốc gia
Dịch vụ Google WebSearch trả về kết quả từ một chỉ mục chính gồm tất cả các tài liệu trên web. Chỉ mục chính chứa các tập hợp con gồm các tài liệu được nhóm theo những thuộc tính cụ thể, như ngôn ngữ và quốc gia xuất xứ.
Bạn có thể sử dụng các thông số yêu cầu lr và cr để hạn chế kết quả tìm kiếm theo các tập hợp con của tài liệu được viết bằng một số ngôn ngữ cụ thể hoặc có nguồn gốc từ một số quốc gia cụ thể, tương ứng.
Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:
- miền cấp cao nhất (TLD) trong URL của tài liệu
- thẻ meta về ngôn ngữ trong tài liệu
- ngôn ngữ chính được dùng trong nội dung của tài liệu
Vui lòng xem thêm định nghĩa về thông số lr, phần Tìm kiếm tài liệu được viết bằng một số ngôn ngữ cụ thể và Giá trị của bộ sưu tập ngôn ngữ có thể được dùng làm giá trị cho thông số lr để biết thêm thông tin về việc hạn chế kết quả dựa trên ngôn ngữ.
Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:
- miền cấp cao nhất (TLD) trong URL của tài liệu
- vị trí địa lý của địa chỉ IP của máy chủ web
Vui lòng xem định nghĩa về tham số cr và Giá trị của bộ sưu tập quốc gia có thể dùng làm giá trị cho tham số cr để biết thêm thông tin về việc hạn chế kết quả theo quốc gia xuất xứ.
Lưu ý: Bạn có thể kết hợp các giá trị ngôn ngữ và giá trị quốc gia để tuỳ chỉnh kết quả tìm kiếm. Ví dụ: bạn có thể yêu cầu cung cấp tài liệu được viết bằng tiếng Pháp và đến từ Pháp hoặc Canada, hoặc bạn có thể yêu cầu cung cấp tài liệu đến từ Hà Lan và không được viết bằng tiếng Anh. Cả hai tham số lr và cr đều hỗ trợ Toán tử Boolean.
Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
Nhiều khách hàng của Google không muốn hiển thị kết quả tìm kiếm cho những trang web có nội dung người lớn. Khi sử dụng bộ lọc Tìm kiếm an toàn, bạn có thể sàng lọc và loại bỏ những kết quả tìm kiếm chứa nội dung người lớn. Bộ lọc của Google sử dụng công nghệ độc quyền để kiểm tra từ khoá, cụm từ và URL. Mặc dù không có bộ lọc nào chính xác 100%, nhưng tính năng Tìm kiếm an toàn sẽ loại bỏ phần lớn nội dung người lớn khỏi kết quả tìm kiếm của bạn.
Google luôn nỗ lực để giữ cho tính năng Tìm kiếm an toàn được cập nhật và toàn diện nhất có thể bằng cách liên tục thu thập dữ liệu trên web và kết hợp các thông tin cập nhật từ đề xuất của người dùng.
Tính năng Tìm kiếm an toàn hỗ trợ các ngôn ngữ sau:
| Tiếng Hà Lan Tiếng Anh Tiếng Pháp Tiếng Đức |
Tiếng Ý Tiếng Bồ Đào Nha (Brazil) Tiếng Tây Ban Nha Tiếng Trung phồn thể |
Bạn có thể điều chỉnh mức độ lọc nội dung người lớn trong kết quả tìm kiếm của Google bằng cách sử dụng tham số truy vấn an toàn. Bảng sau đây giải thích các chế độ cài đặt Tìm kiếm an toàn của Google và mức độ ảnh hưởng của các chế độ cài đặt đó đến kết quả tìm kiếm của bạn:
| Cấp độ Tìm kiếm an toàn | Mô tả |
|---|---|
| cao | Cho phép sử dụng phiên bản tìm kiếm an toàn nghiêm ngặt hơn. |
| trung bình | Chặn các trang web chứa nội dung khiêu dâm và nội dung tình dục phản cảm khác. |
| tắt | Không lọc nội dung người lớn khỏi kết quả tìm kiếm. |
* Chế độ cài đặt mặc định của tính năng Tìm kiếm an toàn là tắt.
Nếu bạn đã kích hoạt tính năng Tìm kiếm an toàn và thấy những trang web chứa nội dung phản cảm trong kết quả, vui lòng gửi URL của trang web đó đến địa chỉ safesearch@google.com. Chúng tôi sẽ điều tra trang web đó.
Kết quả XML
- DTD kết quả XML của Google
- Giới thiệu về phản hồi XML
- Kết quả XML cho cụm từ tìm kiếm thông thường và nâng cao
- Tìm kiếm thông thường/nâng cao: Cụm từ tìm kiếm mẫu và kết quả XML
- Tìm kiếm thông thường/nâng cao: Thẻ XML
DTD kết quả XML của Google
Google sử dụng cùng một DTD để mô tả định dạng XML cho tất cả các loại kết quả tìm kiếm. Nhiều thẻ và thuộc tính áp dụng cho tất cả các loại tìm kiếm. Tuy nhiên, một số thẻ chỉ áp dụng cho một số loại tìm kiếm nhất định. Do đó, các định nghĩa trong DTD có thể ít hạn chế hơn so với các định nghĩa được đưa ra trong tài liệu này.
Tài liệu này mô tả những khía cạnh của DTD có liên quan đến WebSearch. Khi xem DTD, nếu đang làm việc trên WebSearch, bạn có thể yên tâm bỏ qua những thẻ và thuộc tính không được ghi lại ở đây. Nếu định nghĩa khác nhau giữa DTD và tài liệu, thì thực tế đó sẽ được ghi chú trong tài liệu này.
Google có thể trả về kết quả XML có hoặc không có thông tin tham chiếu đến DTD gần đây nhất. DTD là hướng dẫn giúp quản trị viên tìm kiếm và trình phân tích cú pháp XML hiểu được kết quả XML của Google. Vì ngữ pháp XML của Google có thể thay đổi theo thời gian, nên bạn không được định cấu hình trình phân tích cú pháp để sử dụng DTD nhằm xác thực từng kết quả XML.
Ngoài ra, bạn không nên định cấu hình trình phân tích cú pháp XML để tìm nạp DTD mỗi khi gửi yêu cầu tìm kiếm. Google hiếm khi cập nhật DTD và những yêu cầu này tạo ra sự chậm trễ và các yêu cầu không cần thiết về băng thông.
Bạn nên sử dụng định dạng đầu ra xml_no_dtd để nhận kết quả XML. Nếu bạn chỉ định định dạng xml output trong yêu cầu tìm kiếm, thì điểm khác biệt duy nhất là việc đưa dòng sau vào kết quả XML:
<!DOCTYPE GSP SYSTEM "google.dtd">Bạn có thể truy cập vào DTD mới nhất tại http://www.google.com/google.dtd.
Xin lưu ý rằng một số tính năng trong DTD có thể không được cung cấp hoặc hỗ trợ tại thời điểm này.
Giới thiệu về phản hồi XML
- Tất cả các giá trị phần tử đều là HTML hợp lệ, phù hợp để hiển thị, trừ phi có lưu ý khác trong phần định nghĩa thẻ XML.
- Một số giá trị phần tử là URL cần được mã hoá HTML trước khi hiển thị.
- Trình phân tích cú pháp XML của bạn sẽ bỏ qua các thuộc tính và thẻ không có trong tài liệu. Điều này cho phép ứng dụng của bạn tiếp tục hoạt động mà không cần sửa đổi nếu Google thêm các tính năng khác vào đầu ra XML.
- Bạn phải thoát một số ký tự nhất định khi đưa các ký tự đó vào làm giá trị trong thẻ XML. Trình xử lý XML của bạn phải chuyển đổi các thực thể này trở lại thành các ký tự thích hợp. Ví dụ: nếu bạn không chuyển đổi thực thể đúng cách, trình duyệt có thể hiển thị ký tự & dưới dạng "&". Tiêu chuẩn XML ghi lại các ký tự này; các ký tự này được sao chép trong bảng dưới đây:
Ký tự Biểu mẫu thoát Thực thể Mã ký tự Ký hiệu & & & & Dấu nháy đơn ' ' ' Dấu nháy kép " " " Dấu lớn hơn > > > Dấu nhỏ hơn < < <
Kết quả XML cho cụm từ tìm kiếm thông thường và nâng cao
Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML
Yêu cầu WebSearch mẫu này yêu cầu 10 kết quả (num=10) về cụm từ tìm kiếm "socer" (q=socer), đây là từ "soccer" được cố ý viết sai chính tả cho ví dụ này.)
http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i
Yêu cầu này sẽ tạo ra kết quả XML bên dưới. Xin lưu ý rằng có một số nhận xét trong kết quả XML để cho biết vị trí xuất hiện của một số thẻ không có trong kết quả.
<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>
Tìm kiếm thông thường/nâng cao: Thẻ XML
Phản hồi XML cho các yêu cầu tìm kiếm thông thường và yêu cầu tìm kiếm nâng cao đều sử dụng cùng một nhóm thẻ XML. Các thẻ XML này xuất hiện trong ví dụ về XML ở trên và được giải thích trong các bảng bên dưới.
Các thẻ XML bên dưới được liệt kê theo thứ tự bảng chữ cái theo tên thẻ và mỗi định nghĩa thẻ đều có nội dung mô tả về thẻ, ví dụ minh hoạ cách thẻ sẽ xuất hiện trong kết quả XML và định dạng nội dung của thẻ. Nếu thẻ là thẻ con của một thẻ XML khác hoặc nếu thẻ có thẻ con hoặc thuộc tính riêng, thì thông tin đó cũng được cung cấp trong bảng định nghĩa của thẻ.
Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:
* = không hoặc nhiều phiên bản của thẻ phụ
+ = một hoặc nhiều phiên bản của thẻ phụ
| Đáp | B | D | Khắc phục | G | H | I | L | M | B | P | Hỏi | R | N | T | U | X |
| anchor_text | |
|---|---|
| Định nghĩa | Thẻ <anchor_text> chỉ định văn bản mà bạn nên hiển thị cho người dùng để xác định một nhãn tinh chỉnh được liên kết với một tập hợp kết quả tìm kiếm. Vì nhãn tinh chỉnh thay thế các ký tự không phải chữ và số bằng dấu gạch dưới, nên bạn không được hiển thị giá trị của thẻ <label> trong giao diện người dùng. Thay vào đó, bạn nên hiển thị giá trị của thẻ <anchor_text>. |
| Ví dụ | <anchor_text>sân golf</anchor_text> |
| Thẻ phụ của | FacetItem |
| Định dạng nội dung | Văn bản |
| CHẶN | |
|---|---|
| Định nghĩa | Thẻ này bao bọc nội dung của một khối trong dòng nội dung của kết quả quảng bá. Mỗi khối có các thẻ phụ T, U và L. Thẻ T không trống cho biết khối chứa văn bản; thẻ U và L không trống cho biết khối chứa một đường liên kết (với URL được cung cấp trong thẻ phụ U và văn bản liên kết trong thẻ phụ L). |
| Thẻ phụ | T, U, L |
| Thẻ phụ của | BODY_LINE |
| Định dạng nội dung | Trống |
| BODY_LINE | |
|---|---|
| Định nghĩa | Thẻ này bao bọc nội dung của một dòng trong phần nội dung của kết quả được quảng bá. Mỗi dòng nội dung bao gồm một số thẻ BLOCK. Các thẻ này chứa một số văn bản hoặc một đường liên kết có URL và văn bản liên kết. |
| Thẻ phụ | BLOCK* |
| Thẻ phụ của | SL_MAIN |
| Định dạng nội dung | Trống |
| C | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <C> cho biết rằng dịch vụ WebSearch có thể truy xuất phiên bản được lưu vào bộ nhớ đệm của URL kết quả tìm kiếm này. Bạn không thể truy xuất các trang được lưu vào bộ nhớ đệm thông qua XML API, nhưng bạn có thể chuyển hướng người dùng đến www.google.com cho nội dung này. |
|||||||||
| Thuộc tính |
|
|||||||||
| Ví dụ | <C SZ="6k" CID="kvOXK_cYSSgJ" /> | |||||||||
| Thẻ phụ của | HAS | |||||||||
| Định dạng nội dung | Trống | |||||||||
| C2C | |
|---|---|
| Định nghĩa | Thẻ <C2C> cho biết rằng kết quả đề cập đến một trang bằng tiếng Trung phồn thể. Thẻ này chỉ xuất hiện khi bạn bật chế độ Tìm kiếm bằng tiếng Trung giản thể và tiếng Trung phồn thể. Hãy xem định nghĩa về tham số truy vấn c2coff để biết thêm thông tin về cách bật và tắt tính năng này. |
| Định dạng nội dung | Văn bản |
| Ngữ cảnh | |
|---|---|
| Định nghĩa | Thẻ <Context> bao gồm một danh sách các nhãn tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm. |
| Ví dụ | <Context> |
| Thẻ phụ | title, Facet+ |
| Định dạng nội dung | Vùng chứa |
| CRAWLDATE | |
|---|---|
| Định nghĩa | Thẻ <CRAWLDATE> xác định ngày mà trang được thu thập dữ liệu lần gần đây nhất. |
| Ví dụ | <CRAWLDATE>Ngày 21 tháng 5 năm 2005</CRAWLDATE> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản |
| DI | |
|---|---|
| Định nghĩa | Thẻ <DI> bao bọc thông tin danh mục của Dự án Thư mục mở (ODP) cho một kết quả tìm kiếm duy nhất. |
| Ví dụ | <DI> |
| Thẻ phụ | DT?, DS? |
| Thẻ phụ của | HAS |
| Định dạng nội dung | Trống |
| DS | |
|---|---|
| Định nghĩa | Thẻ <DS> cung cấp thông tin tóm tắt được liệt kê cho một danh mục duy nhất trong thư mục ODP. |
| Ví dụ | <DS>Đăng hồ sơ <b>bóng đá</b> của bạn trực tiếp trên Internet.</DS> |
| Thẻ phụ của | DI |
| Định dạng nội dung | Văn bản (có thể chứa HTML) |
| DT (cây thiết bị) | |
|---|---|
| Định nghĩa | Thẻ <DT> cung cấp tiêu đề cho một danh mục duy nhất được liệt kê trong thư mục ODP. |
| Ví dụ | <DT>SoccerConnection.net</DT> |
| Thẻ phụ của | DI |
| Định dạng nội dung | Văn bản (có thể chứa HTML) |
| Thuộc tính | |
|---|---|
| Định nghĩa | Thẻ <Facet> chứa một nhóm logic gồm các thẻ <FacetItem>. Bạn có thể tạo các nhóm này bằng định dạng Thông số kỹ thuật XML của Công cụ tìm kiếm có thể lập trình. Nếu bạn không tạo các nhóm này, thẻ results_xml_tag_Context><Context> sẽ chứa tối đa 4 thẻ <Facet>. Các mục trong mỗi thẻ <Facet> sẽ được nhóm lại cho mục đích hiển thị nhưng có thể không có mối quan hệ logic. |
| Ví dụ | <Facet> |
| Thẻ phụ | FacetItem+, title+ |
| Thẻ phụ của | Bối cảnh |
| Định dạng nội dung | Vùng chứa |
| FacetItem | |
|---|---|
| Định nghĩa | Thẻ <FacetItem> bao gồm thông tin về nhãn tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm. |
| Ví dụ | <FacetItem> |
| Thẻ phụ | label, anchor_text+ |
| Thẻ phụ của | Facet |
| Định dạng nội dung | FacetItem |
| FI | |
|---|---|
| Định nghĩa | Thẻ <FI> đóng vai trò là một cờ cho biết liệu quá trình lọc tài liệu có được thực hiện cho nội dung tìm kiếm hay không. Hãy xem phần Tự động lọc trong tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google. |
| Ví dụ | <FI /> |
| Thẻ phụ của | RES |
| Định dạng nội dung | Trống |
| GSP | |||||||
|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <GSP> bao bọc tất cả dữ liệu được trả về trong kết quả tìm kiếm XML của Google. "GSP" là từ viết tắt của "Giao thức Google Tìm kiếm". |
||||||
| Thuộc tính |
|
||||||
| Ví dụ | <GSP VER="3.2"> | ||||||
| Thẻ phụ | PARAM+, Q, RES?, TM | ||||||
| Định dạng nội dung | Trống | ||||||
| HAS | |
|---|---|
| Định nghĩa | Thẻ <HAS> bao bọc thông tin về mọi tham số yêu cầu tìm kiếm đặc biệt được hỗ trợ cho một URL cụ thể.
Lưu ý: Định nghĩa về <HAS> cho WebSearch có tính hạn chế hơn so với trong DTD. |
| Thẻ phụ | DI?, L? C? RT? |
| Thẻ phụ của | R |
| ISURL | |
|---|---|
| Định nghĩa | Google trả về thẻ <ISURL> nếu cụm từ tìm kiếm được liên kết là một URL. |
| Thẻ phụ của | GSP |
| Định dạng nội dung | Trống |
| L | |
|---|---|
| Định nghĩa | Sự xuất hiện của thẻ <L> cho biết dịch vụ WebSearch có thể tìm thấy những trang web khác liên kết đến URL kết quả tìm kiếm này. Để tìm những trang web như vậy, bạn sẽ sử dụng cụm từ tìm kiếm đặc biệt link:. |
| Thẻ phụ của | HAS |
| Định dạng nội dung | Trống |
| nhãn | |
|---|---|
| Định nghĩa | Thẻ <label> chỉ định nhãn tinh chỉnh mà bạn có thể dùng để lọc kết quả tìm kiếm nhận được. Để sử dụng nhãn tinh chỉnh, hãy thêm chuỗi more:[[label tag value]] vào giá trị của tham số q trong yêu cầu HTTP của bạn đến Google như minh hoạ trong ví dụ sau. Xin lưu ý rằng bạn phải thoát URL cho giá trị này trước khi gửi truy vấn đến Google. This example uses the refinement label golf_courses to Lưu ý: Thẻ <label> không giống với thẻ <Label>. Thẻ này xác định nhãn tinh chỉnh được liên kết với một URL cụ thể trong kết quả tìm kiếm. |
| Ví dụ | <label>golf_courses</label> |
| Thẻ phụ của | FacetItem |
| Định dạng nội dung | Văn bản |
| LANG | |
|---|---|
| Định nghĩa | Thẻ <LANG> chứa thông tin dự đoán chính xác nhất của Google về ngôn ngữ của kết quả tìm kiếm. |
| Ví dụ | <LANG>en</LANG> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản |
| M | |
|---|---|
| Định nghĩa | Thẻ <M> xác định tổng số kết quả ước tính cho lượt tìm kiếm. Lưu ý: Số liệu ước tính này có thể không chính xác. |
| Ví dụ | <M>16200000</M> |
| Thẻ phụ của | RES |
| Định dạng nội dung | Văn bản |
| Sơ sinh | |
|---|---|
| Định nghĩa | Thẻ <NB> bao bọc thông tin điều hướng (đường liên kết đến trang kết quả tìm kiếm tiếp theo hoặc trang kết quả tìm kiếm trước đó) cho tập kết quả. Lưu ý: Thẻ này chỉ xuất hiện nếu có thêm kết quả. |
| Ví dụ | <NB> |
| Thẻ phụ | NU?, PU? |
| Thẻ phụ của | RES |
| Định dạng nội dung | Trống |
| NU | |
|---|---|
| Định nghĩa | Thẻ <NU> chứa một đường liên kết tương đối đến trang kết quả tìm kiếm tiếp theo. |
| Ví dụ | <NU>/search?q=flowers&num=10&hl=en&ie=UTF-8 &output=xml&client=test&start=10</NU> |
| Thẻ phụ của | NB |
| Định dạng nội dung | Văn bản (URL tương đối) |
| PARAM | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <PARAM> xác định một tham số đầu vào được gửi trong yêu cầu HTTP liên kết với kết quả XML. Thông tin về tham số nằm trong các thuộc tính của thẻ – name, value, original_value – và sẽ có một thẻ PARAM cho mỗi tham số được gửi trong yêu cầu HTTP. |
||||||||||||
| Thuộc tính |
|
||||||||||||
| Ví dụ | <PARAM name="cr" value="countryNZ" original_value="countryNZ" /> | ||||||||||||
| Thẻ phụ của | GSP | ||||||||||||
| Định dạng nội dung | Phức tạp | ||||||||||||
| PU | |
|---|---|
| Định nghĩa | Thẻ <PU> cung cấp một đường liên kết tương đối đến trang kết quả tìm kiếm trước đó. |
| Ví dụ | <PU>/search?q=flowers&num=10&hl=en&output=xml &client=test&start=10</PU> |
| Thẻ phụ của | NB |
| Định dạng nội dung | Văn bản (URL tương đối) |
| Hỏi | |
|---|---|
| Định nghĩa | Thẻ <Q> xác định cụm từ tìm kiếm được gửi trong yêu cầu HTTP liên kết với kết quả XML. |
| Ví dụ | <Q>pizza</Q> |
| Thẻ phụ của | GSP |
| Định dạng nội dung | Văn bản |
| Điểm | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <R> bao gồm thông tin chi tiết của từng kết quả tìm kiếm. Lưu ý: Định nghĩa của thẻ <R> cho WebSearch có tính hạn chế hơn so với trong DTD. |
|||||||||
| Thuộc tính |
|
|||||||||
| Thẻ phụ | U, UE, T?, CRAWLDATE, S?, LANG?, HAS | |||||||||
| Thẻ phụ của | RES | |||||||||
| RES | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <RES> bao gồm tập hợp các kết quả tìm kiếm riêng lẻ và thông tin chi tiết về những kết quả đó. |
|||||||||
| Thuộc tính |
|
|||||||||
| Ví dụ | <RES SN="1" EN="10"> | |||||||||
| Thẻ phụ | M, FI?, XT?, NB?, R* | |||||||||
| Thẻ phụ của | GSP | |||||||||
| Định dạng nội dung | Trống | |||||||||
| N | |
|---|---|
| Định nghĩa | Thẻ <S> chứa một đoạn trích cho kết quả tìm kiếm, trong đó các cụm từ tìm kiếm được đánh dấu bằng chữ in đậm. Dấu ngắt dòng được đưa vào đoạn trích để văn bản được xuống dòng đúng cách. |
| Ví dụ | <S>Washington (CNN) – Một nỗ lực nhằm chấm dứt tình trạng bế tắc tại Thượng viện về các đề cử tư pháp của Tổng thống <b>Bush's</b> sẽ cho phép 5 người được đề cử tiến hành bỏ phiếu cuối cùng trong khi vẫn duy trì <b>...<b>...</b><S> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản (HTML) |
| SL_MAIN | |
|---|---|
| Định nghĩa | Thẻ này bao bọc nội dung của một kết quả khuyến mãi. Sử dụng để phân tích cú pháp chương trình khuyến mãi. Văn bản liên kết và URL của đường liên kết tiêu đề nằm trong thẻ phụ T và U tương ứng. Các dòng văn bản nội dung và đường liên kết nằm trong thẻ phụ BODY_LINE. |
| Thẻ phụ | BODY_LINE*, T, U |
| Thẻ phụ của | SL_RESULTS |
| Định dạng nội dung | Trống |
| SL_RESULTS | |
|---|---|
| Định nghĩa | Thẻ trong trình chứa cho kết quả được quảng bá. Một trong những biểu tượng này sẽ xuất hiện bất cứ khi nào bạn có chương trình khuyến mãi trong kết quả tìm kiếm. Thẻ phụ SL_MAIN chứa dữ liệu kết quả chính. |
| Thẻ phụ | SL_MAIN* |
| Thẻ phụ của | R |
| Định dạng nội dung | Trống |
| Chính tả | |
|---|---|
| Định nghĩa | Thẻ <Spelling> bao gồm một gợi ý chính tả thay thế cho cụm từ tìm kiếm đã gửi. Thẻ này chỉ xuất hiện trên trang đầu tiên của kết quả tìm kiếm. Tính năng gợi ý chính tả hiện hỗ trợ tiếng Anh, tiếng Trung, tiếng Nhật và tiếng Hàn. Lưu ý: Google sẽ chỉ trả về đề xuất chính tả cho những cụm từ tìm kiếm có giá trị tham số gl bằng chữ thường. |
| Ví dụ | <Spelling> |
| Thẻ phụ | Đề xuất |
| Thẻ phụ của | GSP |
| Định dạng nội dung | Trống |
| Đề xuất | |||||||
|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <Suggestion> chứa một gợi ý chính tả thay thế cho truy vấn đã gửi. Bạn có thể dùng nội dung của thẻ này để đề xuất gợi ý chính tả thay thế cho người dùng tìm kiếm. Giá trị của thuộc tính q là gợi ý chính tả được thoát URL mà bạn có thể dùng làm cụm từ tìm kiếm. | ||||||
| Thuộc tính |
|
||||||
| Ví dụ | <Suggestion q="soccer"><b><i>soccer</i></b></Suggestion> | ||||||
| Thẻ phụ của | Chính tả | ||||||
| Định dạng nội dung | Văn bản (HTML) | ||||||
| T | |
|---|---|
| Định nghĩa | Thẻ <T> chứa tiêu đề của kết quả. |
| Ví dụ | <T>Amici's East Coast Pizzeria</T> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản (HTML) |
| tiêu đề | |
|---|---|
| Định nghĩa | Là thẻ con của <Context>, thẻ <title> chứa tên của Công cụ tìm kiếm có thể lập trình. Là thẻ con của <Facet>, thẻ <title> cung cấp tiêu đề cho một nhóm khía cạnh. |
| Ví dụ | Là phần tử con của <Context>: <title>Công cụ tìm kiếm của tôi</title> Là thành phần con của <Facet>: <title>facet title</title> |
| Thẻ phụ của | Context (Ngữ cảnh), Facet (Khía cạnh) |
| Định dạng nội dung | Văn bản |
| TM | |
|---|---|
| Định nghĩa | Thẻ <TM> xác định tổng thời gian máy chủ cần thiết để trả về kết quả tìm kiếm, được đo bằng giây. |
| Ví dụ | <TM>0.100445</TM> |
| Thẻ phụ của | GSP |
| Định dạng nội dung | Văn bản (Số dấu phẩy động) |
| TT | |
|---|---|
| Định nghĩa | Thẻ <TT> cung cấp một mẹo tìm kiếm. |
| Ví dụ | <TT><i>Lưu ý: Đối với hầu hết các trình duyệt, việc nhấn phím Return sẽ cho ra kết quả tương tự như khi bạn nhấp vào nút Tìm kiếm.</i></TT> |
| Thẻ phụ của | GSP |
| U | |
|---|---|
| Định nghĩa | Thẻ <U> cung cấp URL của kết quả tìm kiếm. |
| Ví dụ | <U>http://www.dominos.com/</U> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản (URL tuyệt đối) |
| UD | |
|---|---|
| Định nghĩa | Thẻ <UD> cung cấp URL được mã hoá IDN (Tên miền quốc tế) cho kết quả tìm kiếm. Giá trị này cho phép hiển thị các miền bằng ngôn ngữ địa phương. Ví dụ: URL được mã hoá IDN http://www.%E8%8A%B1%E4%BA%95.com có thể được giải mã và hiển thị dưới dạng http://www.花井鮨.com. Thẻ <UD> này sẽ chỉ được đưa vào kết quả tìm kiếm cho những yêu cầu có tham số ud. Lưu ý: Đây là một tính năng thử nghiệm. |
| Ví dụ | <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản (URL được mã hoá IDN) |
| UE | |
|---|---|
| Định nghĩa | Thẻ <UE> cung cấp URL của kết quả tìm kiếm. Giá trị này được thoát URL để phù hợp với việc truyền dưới dạng tham số truy vấn trong URL. |
| Ví dụ | <UE>http://www.dominos.com/</UE> |
| Thẻ phụ của | R |
| Định dạng nội dung | Văn bản (URL đã thoát) |
| XT | |
|---|---|
| Định nghĩa | Thẻ <XT> cho biết tổng số kết quả ước tính (do thẻ M chỉ định) thực sự là tổng số kết quả chính xác. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin chi tiết. |
| Ví dụ | <XT /> |
| Thẻ phụ của | RES |
| Định dạng nội dung | Trống |
Kết quả XML cho các cụm từ tìm kiếm hình ảnh
Yêu cầu này về Hình ảnh yêu cầu 5 kết quả (num=5) về cụm từ tìm kiếm "monkey" (q=monkey).
http://www.google.com/cse? searchtype=image &num=2 &q=monkey &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
Yêu cầu này sẽ cho ra kết quả XML bên dưới.
<GSP VER="3.2">
<TM>0.395037</TM>
<Q>monkeys</Q>
<PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
<PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
<PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
<PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
<PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
<PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
<PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
<PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
<PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>
<Context>
<title>domestigeek</title>
</Context>
<ARES/>
<RES SN="1" EN="2">
<M>2500000</M>
<NB>
<NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
&ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
</NU>
</NB>
<RG START="1" SIZE="2"/>
<R N="1" MIME="image/jpeg">
<RU>http://www.flickr.com/photos/fncll/135465558/</RU>
<U>
http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
</U>
<UE>
http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
</UE>
<T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
<RK>0</RK>
<BYLINEDATE>1146034800</BYLINEDATE>
<S>Computer <b>Monkeys</b> | Flickr</S>
<LANG>en</LANG>
<IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
<SZ>88386</SZ>
<IN/>
</IMG>
<TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
</R>
<R N="2" MIME="image/jpeg">
<RU>
http://www.flickr.com/photos/flickerbulb/187044366/
</RU>
<U>
http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
</U>
<UE>
http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
</UE>
<T>
one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
</T>
<RK>0</RK>
<BYLINEDATE>1152514800</BYLINEDATE>
<S>one. ugly. <b>monkey</b>.</S>
<LANG>en</LANG>
<IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
EF4tQQnDDKOq0"><SZ>58339</SZ>
<IN/>
</IMG>
<TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
</R>
</RES>
</GSP>Tìm kiếm hình ảnh: Thẻ XML
Bảng dưới đây cho thấy các thẻ XML bổ sung được dùng trong phản hồi XML cho cụm từ tìm kiếm hình ảnh.
Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:
* = không hoặc nhiều phiên bản của thẻ phụ
+ = một hoặc nhiều phiên bản của thẻ phụ
| RG | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Định nghĩa | Thẻ <RG> bao gồm thông tin chi tiết về từng kết quả tìm kiếm hình ảnh. |
|||||||||
| Thuộc tính |
| |||||||||
| Thẻ phụ của | RES | |||||||||
| RU (Nga) | |
|---|---|
| Định nghĩa | Thẻ <RU tag> bao gồm thông tin chi tiết của từng kết quả tìm kiếm hình ảnh. |
| Thẻ phụ của | R |