Ta strona dotyczy wersji XML interfejsu Custom Search JSON API, która jest dostępna tylko dla klientów Wyszukiwania w witrynie Google.
- Omówienie
- Format żądania Wyszukiwarki niestandardowej
- Wyniki w formacie XML
Przegląd
Usługa wyszukiwania w internecie Google umożliwia klientom wyszukiwarki Google w witrynie wyświetlanie wyników wyszukiwania Google w ich własnych witrynach. Usługa wyszukiwania w internecie korzysta z prostego protokołu opartego na HTTP do wyświetlania wyników wyszukiwania. Administratorzy wyszukiwania mają pełną kontrolę nad sposobem, w jaki żądają wyników wyszukiwania, i sposobem, w jaki prezentują te wyniki użytkownikowi końcowemu. W tym dokumencie opisano szczegóły techniczne formatów żądań i wyników wyszukiwania Google.
Aby pobrać wyniki wyszukiwania w internecie Google, aplikacja wysyła do Google proste żądanie HTTP. Google zwraca wyniki wyszukiwania w formacie XML. Wyniki w formacie XML umożliwiają dostosowanie sposobu wyświetlania wyników wyszukiwania.
Format żądania WebSearch
- Prośba Omówienie
- Wyszukiwane hasła
- Parametry żądania
- Przykładowe zapytania do wyszukiwarki
- WebSearch Query Definicje parametrów
- Przykładowe zapytania dotyczące obrazów
- Zapytanie wyszukiwania obrazów Definicje parametrów
- Szukanie zaawansowane
- Szukanie zaawansowane Parametry zapytania
- Specjalne warunki zapytań
- Limity żądań
Żądanie – informacje
Żądanie wyszukiwania w Google to standardowe polecenie HTTP GET. Zawiera zbiór parametrów związanych z Twoimi zapytaniami. Parametry te są uwzględniane w adresie URL żądania jako pary name=value oddzielone znakiem „&”. Parametry obejmują dane takie jak zapytanie i unikalny identyfikator wyszukiwarki (cx), który identyfikuje wyszukiwarkę wysyłającą żądanie HTTP. Usługa WebSearch lub Image Search zwraca wyniki w formacie XML w odpowiedzi na Twoje żądania HTTP.
Wyszukiwane hasła
Większość żądań wyszukiwania zawiera co najmniej 1 wyszukiwane hasło. Termin zapytania pojawia się jako wartość parametru w żądaniu wyszukiwania.
Terminy zapytania mogą określać kilka rodzajów informacji, aby filtrować i porządkować wyniki wyszukiwania zwracane przez Google. Zapytania mogą określać:
- Słowa lub wyrażenia, które chcesz uwzględnić lub wykluczyć.
- Wszystkie słowa w zapytaniu (domyślnie)
- dokładna fraza w zapytaniu,
- dowolne słowo lub wyrażenie w zapytaniu
- Gdzie w dokumencie szukać wyszukiwanych haseł
-
.
- W dowolnym miejscu dokumentu (domyślnie)
- Tylko w linkach w dokumencie
- Ograniczenia dotyczące samych dokumentów
- uwzględnianie lub wykluczanie dokumentów określonych typów plików (np. plików PDF lub dokumentów Word);
- Specjalne zapytania dotyczące adresu URL, które zwracają informacje o danym adresie URL, a nie przeprowadzają wyszukiwania.
- Zapytania, które zwracają ogólne informacje o adresie URL, takie jak kategoria w Open Directory, fragment lub język.
- Zapytania, które zwracają zestaw stron internetowych z linkami do adresu URL
- Zapytania, które zwracają zbiór stron podobnych do danego adresu URL
Domyślne wyszukiwanie
Wartości parametrów zapytania wyszukiwania muszą być zakodowane na potrzeby adresu URL. Pamiętaj, że w zapytaniu wyszukiwania musisz zastąpić znakiem plusa („+”) wszystkie sekwencje białych znaków. Więcej informacji znajdziesz w sekcji Kodowanie adresów URL w tym dokumencie.
Wyszukiwane hasło jest przesyłane do usługi WebSearch za pomocą parametru q. Przykładowe wyszukiwane hasło:
q=horses+cows+pigs
Domyślnie usługa Google WebSearch zwraca tylko dokumenty, które zawierają wszystkie terminy z zapytania.
Parametry żądania
W tej sekcji znajdziesz listę parametrów, których możesz używać podczas wysyłania żądania wyszukiwania. Parametry są podzielone na 2 listy. Pierwsza lista zawiera parametry, które są istotne w przypadku wszystkich żądań wyszukiwania. Druga lista zawiera parametry, które są istotne tylko w przypadku zaawansowanych zapytań wyszukiwania.
Wymagane są 3 parametry żądania:
- Parametr client musi mieć wartość
google-csbe. - Parametr output określa format zwracanych wyników XML. Wyniki mogą być zwracane z odwołaniem do pliku DTD Google (xml) lub bez niego (
xml_no_dtd). Zalecamy ustawienie tej wartości naxml_no_dtd. Uwaga: jeśli nie określisz tego parametru, wyniki będą zwracane w formacie HTML zamiast XML.
- Parametr cx, który reprezentuje unikalny identyfikator wyszukiwarki.
Najczęściej używane parametry żądania inne niż wymienione powyżej to:
Przykładowe zapytania w wyszukiwarce
Poniższe przykłady pokazują kilka żądań HTTP WebSearch, aby zilustrować, jak używane są różne parametry zapytania. Definicje różnych parametrów zapytania znajdziesz w sekcjach Definicje parametrów zapytania WebSearch i Parametry zapytania wyszukiwania zaawansowanego w tym dokumencie.
To żądanie dotyczy pierwszych 10 wyników (start=0&num=10) dla zapytania „red sox” (q=red+sox). Zapytanie określa też, że wyniki powinny pochodzić z kanadyjskich witryn (cr=countryCA) i być napisane w języku francuskim (lr=lang_fr). Na koniec zapytanie określa wartości parametrów client, output i cx, z których wszystkie 3 są wymagane.
http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
W tym przykładzie użyto niektórych parametrów zapytania wyszukiwania zaawansowanego, aby jeszcze bardziej dostosować zapytanie. To żądanie używa parametru as_q (as_q=red+sox) zamiast parametru q. Używa też parametru as_eq, aby wykluczyć z wyników wyszukiwania dokumenty zawierające słowo „Yankees” (as_eq=yankees).
http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
Definicje parametrów zapytania wyszukiwarki
| c2coff | |||||||
|---|---|---|---|---|---|---|---|
| Opis | Opcjonalnie. Parametr c2coff włącza lub wyłącza funkcję wyszukiwania w języku chińskim uproszczonym i tradycyjnym. Domyślna wartość tego parametru to
|
||||||
| Przykłady | q=google&c2coff=1 |
||||||
| klient | |
|---|---|
| Opis | Wymagany. Parametr |
| Przykłady | q=google&client=google-csbe |
| cr | |
|---|---|
| Opis | Opcjonalnie. Parametr Google WebSearch określa kraj dokumentu na podstawie analizy:
Listę prawidłowych wartości tego parametru znajdziesz w sekcji Wartości parametru Country (cr). |
| Przykłady | q=Frodo&cr=countryNZ |
| cx | |
|---|---|
| Opis | Wymagany. Parametr |
| Przykłady | q=Frodo&cx=00255077836266642015:u-scht7a-8i |
| filtr | |||||||
|---|---|---|---|---|---|---|---|
| Opis | Opcjonalnie. Parametr filter włącza lub wyłącza automatyczne filtrowanie wyników wyszukiwania w Google. Więcej informacji o filtrach wyników wyszukiwania Google znajdziesz w sekcji Automatyczne filtrowanie w tym dokumencie. Wartość domyślna parametru
Uwaga: domyślnie Google stosuje filtrowanie do wszystkich wyników wyszukiwania, aby poprawić ich jakość. |
||||||
| Przykłady | q=google&filter=0 |
||||||
| gl | |
|---|---|
| Opis | Opcjonalnie. Wartość parametru Określenie wartości parametru |
| Przykłady | Ta prośba promuje dokumenty napisane w Wielkiej Brytanii w wynikach wyszukiwania w internecie: |
| hl | |
|---|---|
| Opis | Opcjonalnie. Parametr Więcej informacji znajdziesz w sekcji Języki interfejsu w artykule Internacjonalizacja zapytań i prezentacji wyników, a listę obsługiwanych języków w artykule Obsługiwane języki interfejsu. |
| Przykłady | To żądanie jest kierowane na reklamy wina w języku francuskim. (Vin to francuskie słowo oznaczające wino). q=vin&ip=10.10.10.10&ad=w5&hl=fr |
| hq | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady | To żądanie wyszukuje słowa „pizza” I „ser”. Wyrażenie jest takie samo jak
|
| ie | |
|---|---|
| Opis | Opcjonalnie. Parametr Więcej informacji o tym, kiedy może być potrzebny ten parametr, znajdziesz w sekcji Kodowanie znaków. Listę możliwych wartości |
| Przykłady | q=google&ie=utf8&oe=utf8 |
| lr | |
|---|---|
| Opis | Opcjonalnie. Parametr Google WebSearch określa język dokumentu na podstawie analizy:
Listę prawidłowych wartości tego parametru znajdziesz w sekcji Wartości kolekcji parametru Język ( |
| Przykłady | q=Frodo&lr=lang_en |
| num | |
|---|---|
| Opis | Opcjonalnie. Parametr Domyślna wartość Uwaga: jeśli łączna liczba wyników wyszukiwania jest mniejsza niż żądana liczba wyników, zostaną zwrócone wszystkie dostępne wyniki wyszukiwania. |
| Przykłady | q=google&num=10 |
| oe | |
|---|---|
| Opis | Opcjonalnie. Parametr Więcej informacji o tym, kiedy może być potrzebny ten parametr, znajdziesz w sekcji Kodowanie znaków. Listę możliwych wartości |
| Przykłady | q=google&ie=utf8&oe=utf8 |
| output | |||||||
|---|---|---|---|---|---|---|---|
| Opis | Wymagany. Parametr
|
||||||
| Przykłady | output=xml_no_dtd |
||||||
| q | |
|---|---|
| Opis | Opcjonalnie. Parametr Istnieje też wiele specjalnych terminów zapytań, których można używać jako części wartości parametru Panel sterowania wyszukiwarki Google zawiera raport z najpopularniejszymi zapytaniami przesłanymi za pomocą parametru Uwaga: wartość określona dla parametru q musi być zakodowana na potrzeby adresu URL. |
| Przykłady | q=vacation&as_oq=london+paris |
| bezpieczeństwo | |||||||||
|---|---|---|---|---|---|---|---|---|---|
| Opis | Opcjonalnie. Parametr
Więcej informacji o tej funkcji znajdziesz w sekcji Filtrowanie treści dla dorosłych za pomocą SafeSearch. |
||||||||
| Przykłady | q=adult&safe=high |
||||||||
| rozpocznij | |
|---|---|
| Opis | Opcjonalnie. Parametr Parametr |
| Przykłady | start=10 |
| sortuj | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady |
|
| ud | |
|---|---|
| Opis | Opcjonalnie. Parametr http://www.花井鮨.com Prawidłowe wartości tego parametru to Jeśli parametr http://www.xn--elq438j.com. Uwaga: jest to funkcja beta. |
| Przykłady | q=google&ud=1 |
Szukanie zaawansowane
Dodatkowe parametry zapytania wymienione pod obrazem są istotne w przypadku zaawansowanych zapytań. Gdy przesyłasz wyszukiwanie zaawansowane, wartości kilku parametrów (np. as_eq, as_epq, as_oq itp.) są uwzględniane w warunkach wyszukiwania. Ilustracja przedstawiająca stronę wyszukiwania zaawansowanego Google. Na ilustracji nazwa każdego parametru wyszukiwania zaawansowanego jest napisana czerwonym tekstem w polu na stronie, do którego odnosi się ten parametr, lub obok niego.
Parametry zapytania wyszukiwania zaawansowanego
| as_dt | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady | as_dt=i,as_dt=e |
| as_epq | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady | as_epq=abraham+lincoln |
| as_eq | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady |
|
| as_lq | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady |
|
| as_nlo | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady | Poniższy kod ustawia zakres wyszukiwania od 5 do 10 włącznie:
|
| as_nhi | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady | Poniższy kod ustawia zakres wyszukiwania od 5 do 10 włącznie:
|
| as_oq | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady |
|
| as_q | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady |
|
| as_qdr | |
|---|---|
| Opis | Opcjonalnie. Parametr
|
| Przykłady |
W tym przykładzie żądamy wyników z ostatniego roku:
W tym przykładzie żądamy wyników z ostatnich 10 dni:
|
| as_sitesearch | |
|---|---|
| Opis | Opcjonalnie. Parametr |
| Przykłady |
|
Specjalne wyszukiwane hasła
Wyszukiwarka Google umożliwia używanie kilku specjalnych terminów wyszukiwania, które zapewniają dostęp do dodatkowych funkcji wyszukiwarki Google. Te specjalne terminy wyszukiwania powinny być uwzględnione w wartości parametru żądania q. Podobnie jak inne hasła w zapytaniu, specjalne hasła w zapytaniu muszą mieć kodowanie URL. Wiele specjalnych terminów zapytania zawiera dwukropek (:). Ten znak również musi mieć zmienione znaczenie na potrzeby adresu URL. Jego wartość po zmianie znaczenia to %3A.
| Linki zwrotne [link:] | |
|---|---|
| Opis | Zapytanie Wersja adresu Możesz też użyć parametru żądania as_lq, aby przesłać żądanie Uwaga: podczas korzystania z operatora |
| Przykłady |
|
| Wyszukiwanie z użyciem operatora logicznego LUB [ OR ] | |
|---|---|
| Opis | Wyszukiwane hasło Możesz też użyć parametru żądania as_oq, aby przesłać wyszukiwanie dowolnego terminu z zestawu terminów. Uwaga: jeśli w żądaniu wyszukiwania podasz zapytanie „London+OR+Paris”, wyniki wyszukiwania będą zawierać dokumenty, które zawierają co najmniej jedno z tych dwóch słów. W niektórych przypadkach dokumenty w wynikach wyszukiwania mogą zawierać oba słowa. |
| Przykłady | Wyszukaj Londyn lub Paryż: Dane wejściowe użytkownika:
london OR
paris Wyszukiwane hasło:q=london+OR+parisWyszukaj wakacje i Londyn lub Paryż: Wyszukiwane hasło:
q=vacation+london+OR+parisWyszukaj „wakacje” i jedno z tych słów: „Londyn”, „Paryż” lub „czekoladki”: Wyszukiwane hasło:
q=vacation+london+OR+paris+OR+chocolatesWyszukaj hasła „wakacje” i „czekoladki” oraz „Londyn” lub „Paryż”, przy czym najmniejszą wagę przypisz do słowa „czekoladki”: Wyszukiwane hasło:
q=vacation+london+OR+paris+chocolatesWyszukaj w dokumentach słowa „wakacje”, „czekoladki” i „kwiaty”, które zawierają też słowa „Londyn” lub „Paryż”: Wyszukiwane hasło:
q=vacation+london+OR+paris+chocolates+flowersWyszukaj wakacje i jedno z miast: Londyn lub Paryż, a także jedno z słów: czekoladki lub kwiaty: Wyszukiwane hasło: q=vacation+london+OR+paris+chocolates+OR+flowers |
| Wyklucz wyszukiwane hasło [-] | |
|---|---|
| Opis | Wykluczanie ( Wersja adresu Wykluczanie wyszukiwanego hasła jest przydatne, gdy wyszukiwane hasło ma więcej niż jedno znaczenie. Na przykład słowo „bass” może zwrócić wyniki dotyczące ryb lub muzyki. Jeśli szukasz dokumentów o rybach, możesz wykluczyć z wyników wyszukiwania dokumenty o muzyce, używając wykluczającego wyszukiwanego hasła. Możesz też użyć parametru żądania as_eq, aby wykluczyć z wyników wyszukiwania dokumenty pasujące do określonego słowa lub wyrażenia. |
| Przykłady | Dane wejściowe użytkownika: bass -musicWyszukiwane hasło: q=bass+%2Dmusic |
| Wykluczenie typu pliku [ -filetype: ] | |
|---|---|
| Opis | Zapytanie Wersja adresu Uwaga: możesz wykluczyć z wyników wyszukiwania wiele typów plików, dodając do zapytania więcej terminów Google obsługuje te typy plików:
W przyszłości możemy dodać obsługę kolejnych typów plików. Aktualną listę znajdziesz w odpowiedziach na najczęstsze pytania dotyczące typów plików. |
| Przykłady | Ten przykład zwraca dokumenty, w których występuje słowo „Google”, ale które nie są dokumentami PDF: Ten przykład zwraca dokumenty, w których występuje słowo „Google”, ale wyklucza dokumenty PDF i dokumenty Worda: |
| Filtrowanie według typu pliku [ filetype: ] | |
|---|---|
| Opis | Wyszukiwane hasło Wersja adresu Możesz ograniczyć wyniki wyszukiwania do dokumentów pasujących do jednego z kilku rozszerzeń plików, dodając do zapytania więcej terminów Domyślnie wyniki wyszukiwania obejmują dokumenty z dowolnym rozszerzeniem pliku. Google obsługuje te typy plików:
W przyszłości możemy dodać obsługę kolejnych typów plików. Aktualną listę znajdziesz w odpowiedziach na najczęstsze pytania dotyczące typów plików. |
| Przykłady | Ten przykład zwraca dokumenty PDF, w których występuje słowo „Google”: Ten przykład zwraca dokumenty PDF i Word, w których występuje słowo „Google”: |
| Uwzględnij wyszukiwane hasło [+] | |
|---|---|
| Opis | Termin zapytania „include” (+) oznacza, że słowo lub wyrażenie musi występować we wszystkich dokumentach uwzględnionych w wynikach wyszukiwania. Aby użyć terminu zapytania „include”, przed słowem lub wyrażeniem, które musi być uwzględnione we wszystkich wynikach wyszukiwania, wpisz znak „+” (plus). Wersja znaku Symbolu |
| Przykłady | Dane wejściowe użytkownika: Star Wars Episode +IWyszukiwane hasło: q=Star+Wars+Episode+%2BI |
| Wyszukiwanie tylko linków, wszystkie słowa [ allinlinks: ] | |
|---|---|
| Opis | Termin zapytania Jeśli zapytanie zawiera termin Wersja adresu |
| Przykłady | Dane wejściowe użytkownika:allinlinks: Google searchWyszukiwane hasło: q=allinlinks%3A+Google+search |
| Wyszukiwanie fraz | |
|---|---|
| Opis | Zapytanie wyszukiwania fraz (") umożliwia wyszukiwanie całych fraz poprzez umieszczenie ich w cudzysłowie lub połączenie ich myślnikami. Wersja znaku Wyszukiwanie wyrażeń jest szczególnie przydatne, gdy szukasz słynnych cytatów lub nazw własnych. Aby przesłać wyszukiwanie frazy, możesz też użyć parametru żądania as_epq. |
| Przykłady | Dane wejściowe użytkownika:"Abraham Lincoln"Wyszukiwane hasło: q=%22Abraham+Lincoln%22 |
| Informacje o dokumencie internetowym [info:] | |
|---|---|
| Opis | Zapytanie Wersja znaku Uwaga: podczas korzystania z operatora |
| Przykłady | Dane wejściowe użytkownika: info:www.google.comWyszukiwane hasło: q=info%3Awww.google.com |
Przykładowe zapytania dotyczące obrazów
Poniższe przykłady pokazują kilka żądań HTTP dotyczących obrazów, aby zilustrować, jak używane są różne parametry zapytania. Definicje poszczególnych parametrów zapytania znajdziesz w sekcjach Definicje parametrów zapytania dotyczących obrazów w tym dokumencie.
W tym żądaniu prosisz o pierwsze 5 wyników (start=0&num=5) dla zapytania „monkey” (q=monkey) w pliku typu PNG. Na koniec zapytanie określa wartości parametrów client, output i cx, które są wymagane.
http://www.google.com/cse? searchtype=image start=0 &num=5 &q=monkey &as_filetype=png &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
Parametry zapytania w wyszukiwarce grafiki
| as_filetype | |
|---|---|
| Opis | Opcjonalnie. Zwraca obrazy określonego typu. Dozwolone wartości to: |
| Przykłady | q=google&as_filetype=png |
| imgsz | |
|---|---|
| Opis | Opcjonalnie. Zwraca obrazy o określonym rozmiarze, który może być jednym z tych:
|
| Przykłady | q=google&as_filetype=png&imgsz=icon |
| imgtype | |
|---|---|
| Opis | Opcjonalnie. Zwraca obrazy określonego typu, który może być jednym z tych rodzajów:
|
| Przykłady | q=google&as_filetype=png&imgtype=photo |
| imgc | |
|---|---|
| Opis | Opcjonalnie. Zwraca obrazy czarno-białe, w skali szarości lub kolorowe:
|
| Przykłady | q=google&as_filetype=png&imgc=gray |
| imgcolor | |
|---|---|
| Opis | Opcjonalnie. Zwraca obrazy o określonym kolorze dominującym:
|
| Przykłady | q=google&as_filetype=png&imgcolor=yellow |
| as_rights | |
|---|---|
| Opis | Opcjonalnie. Filtry oparte na licencjonowaniu. Obsługiwane wartości to:
|
| Przykłady | q=cats&as_filetype=png&as_rights=cc_attribute |
Limity żądań
W tabeli poniżej znajdziesz ograniczenia dotyczące żądań wyszukiwania, które możesz wysyłać do Google:
| Komponent | Limit | Komentarz |
|---|---|---|
| Długość żądania wyszukiwania | 2048 bajtów | |
| Liczba haseł w zapytaniu | 10 | obejmuje terminy w tych parametrach: q, as_epq, as_eq, as_lq, as_oq, as_q. |
| Liczba wyników | 20 | Jeśli ustawisz parametr num na liczbę większą niż 20, zwracanych będzie tylko 20 wyników. Aby uzyskać więcej wyników, musisz wysłać kilka żądań i zwiększać wartość parametru start w każdym z nich. |
Internacjonalizacja zapytań i prezentacji wyników
Usługa wyszukiwania w internecie Google umożliwia wyszukiwanie dokumentów w wielu językach. Możesz określić kodowanie znaków, które ma być używane do interpretowania żądania HTTP i kodowania odpowiedzi XML (za pomocą parametrów wyszukiwania ie i oe). Możesz też filtrować wyniki, aby uwzględniać tylko dokumenty napisane w określonych językach.
W kolejnych sekcjach omówimy problemy związane z wyszukiwaniem w wielu językach:
Kodowanie znaków
Serwery wysyłają dane, np. strony internetowe, do klientów użytkownika, np. przeglądarek, w postaci sekwencji zakodowanych bajtów. Klient użytkownika dekoduje następnie bajty w sekwencję znaków. Podczas wysyłania żądań do usługi WebSearch możesz określić schematy kodowania zarówno dla wyszukiwanego hasła, jak i dla otrzymywanej odpowiedzi XML.
Za pomocą parametru żądania ie możesz określić mechanizm kodowania znaków w żądaniu HTTP. Możesz też użyć parametru oe, aby określić schemat kodowania, którego Google ma użyć do zakodowania odpowiedzi XML. Jeśli używasz schematu kodowania innego niż ISO-8859-1 (lub latin1), upewnij się, że podajesz prawidłowe wartości parametrów ie i oe.
Uwaga: jeśli udostępniasz funkcję wyszukiwania w wielu językach, zalecamy używanie wartości kodowania utf8 (UTF-8) w przypadku parametrów ie i oe.
Pełną listę wartości, których możesz użyć w przypadku parametrów ie i oe, znajdziesz w dodatku Schematy kodowania znaków.
Więcej ogólnych informacji o kodowaniu znaków znajdziesz na stronie http://www.w3.org/TR/REC-html40/charset.html.
Języki interfejsu
Parametru żądania hl możesz używać do określania języka interfejsu graficznego. Wartość parametru hl może wpływać na wyniki wyszukiwania XML, zwłaszcza w przypadku zapytań międzynarodowych, gdy ograniczenie językowe (za pomocą parametru lr) nie jest wyraźnie określone. W takich przypadkach parametr hl może promować wyniki wyszukiwania w tym samym języku co język wprowadzania danych przez użytkownika.
Zalecamy wyraźne ustawienie parametru hl w wynikach wyszukiwania, aby mieć pewność, że Google wybierze dla każdego zapytania wyniki wyszukiwania o najwyższej jakości.
Pełną listę prawidłowych wartości parametru hl znajdziesz w sekcji Obsługiwane języki interfejsu.
Wyszukiwanie dokumentów napisanych w określonych językach
Parametru żądania lr możesz używać, aby ograniczać wyniki wyszukiwania do dokumentów napisanych w konkretnym języku lub w określonym zestawie języków.
Parametr lr obsługuje operatory logiczne, które umożliwiają określenie wielu języków, które mają być uwzględniane (lub wykluczane) z wyników wyszukiwania.
Poniższe przykłady pokazują, jak używać operatorów logicznych do wysyłania żądań dokumentów w różnych językach.
W przypadku dokumentów napisanych w języku japońskim:
lr=lang_jp
W przypadku dokumentów napisanych w języku włoskim lub niemieckim:
lr=lang_it|lang_de
W przypadku dokumentów napisanych w języku innym niż węgierski lub czeski:
lr=(-lang_hu).(-lang_cs)
Pełną listę możliwych wartości parametru lr znajdziesz w sekcji Wartości kolekcji języków, a szczegółowe omówienie użycia tych operatorów znajdziesz w sekcji Operatory logiczne.
Wyszukiwanie w języku chińskim uproszczonym i tradycyjnym
Chiński uproszczony i chiński tradycyjny to dwie odmiany pisma w języku chińskim. Ta sama koncepcja może być zapisana w różny sposób w poszczególnych wariantach. Gdy użytkownik wpisze zapytanie w jednym z wariantów, usługa Google WebSearch może zwrócić wyniki zawierające strony w obu wariantach.
Aby korzystać z tej funkcji:
- Ustaw parametr żądania c2coff na 0
i - Wykonaj jedną z tych czynności:
Ten przykład pokazuje parametry zapytania, które należy uwzględnić w żądaniu wyników w języku chińskim uproszczonym i tradycyjnym. (Pamiętaj, że w przykładzie nie uwzględniono dodatkowych wymaganych informacji, takich jak klient).
search?hl=zh-CN
&lr=lang_zh-TW|lang_zh-CN
&c2coff=0Filtrowanie wyników
Wyszukiwarka Google oferuje kilka sposobów filtrowania wyników wyszukiwania:
- Automatyczne filtrowanie wyników wyszukiwania
- Filtrowanie według języka i kraju
- Filtrowanie treści dla dorosłych za pomocą filtra SafeSearch
Automatyczne filtrowanie wyników wyszukiwania
Starając się wyświetlać jak najlepsze wyniki wyszukiwania, Google stosuje 2 metody, aby automatycznie odfiltrowywać wyniki wyszukiwania, które są na ogół niepożądane:
-
Powielone treści – jeśli wiele dokumentów zawiera te same informacje, w wynikach wyszukiwania znajdzie się tylko najtrafniejszy dokument z tego zestawu.
-
Nagromadzenie hostów – jeśli z tej samej witryny pochodzi wiele wyników wyszukiwania, Google może nie wyświetlać wszystkich wyników z tej witryny lub wyświetlać je na niższych pozycjach w rankingu, niż miałyby w innej sytuacji.
W przypadku typowych zapytań zalecamy pozostawienie tych filtrów włączonych, ponieważ znacznie poprawiają one jakość większości wyników wyszukiwania. Możesz jednak pominąć te automatyczne filtry, ustawiając w żądaniu wyszukiwania parametr zapytania filter na 0.
Filtrowanie według języka i kraju
Usługa Google WebSearch zwraca wyniki z głównego indeksu wszystkich dokumentów internetowych. Indeks główny zawiera podzbiory dokumentów pogrupowane według określonych atrybutów, m.in. języka i kraju pochodzenia.
Parametrów żądań lr i cr możesz używać, aby ograniczać wyniki wyszukiwania do podzbiorów dokumentów napisanych w konkretnych językach lub pochodzących z konkretnych krajów.
Google WebSearch określa język dokumentu na podstawie analizy:
- domeny najwyższego poziomu (TLD) adresu URL dokumentu,
- metatagów językowych występujących w dokumencie,
- głównego języka użytego w tekście dokumentu.
Więcej informacji o ograniczaniu wyników na podstawie języka znajdziesz też w definicji parametru lr, w sekcji Wyszukiwanie dokumentów napisanych w określonych językach oraz w wartościach kolekcji języków, które mogą być używane jako wartości parametru lr.
Google WebSearch określa kraj dokumentu na podstawie analizy:
- domeny najwyższego poziomu (TLD) adresu URL dokumentu,
- położenie geograficzne adresu IP serwera WWW,
Więcej informacji o ograniczaniu wyników według kraju pochodzenia znajdziesz w definicji parametru cr i w wartościach kolekcji krajów, które można stosować jako wartości parametru cr.
Uwaga: aby dostosowywać wyniki wyszukiwania, możesz łączyć wartości językowe z wartościami krajów. Możesz na przykład poprosić o dokumenty napisane w języku francuskim i pochodzące z Francji lub Kanady albo o dokumenty pochodzące z Holandii, które nie są napisane w języku angielskim. Parametry lr i cr obsługują operatory logiczne.
Filtrowanie treści dla dorosłych za pomocą filtra SafeSearch
Wielu klientów Google nie chce wyświetlać wyników wyszukiwania witryn zawierających treści dla dorosłych. Za pomocą filtra SafeSearch możesz wykrywać i usuwać wyniki wyszukiwania zawierające treści dla dorosłych. Filtry Google wykorzystują technologię własną do sprawdzania słów kluczowych, wyrażeń i adresów URL. Żaden filtr nie jest w 100% skuteczny, ale SafeSearch usuwa z wyników wyszukiwania zdecydowaną większość treści dla dorosłych.
Staramy się, aby filtr SafeSearch był jak najbardziej aktualny i kompleksowy. W tym celu stale indeksujemy internet i uwzględniamy aktualizacje na podstawie sugestii użytkowników.
Filtr SafeSearch jest dostępny w tych językach:
| angielski francuski niderlandzki niemiecki |
włoski portugalski (brazylijski) hiszpański chiński tradycyjny |
Za pomocą parametru zapytania safe możesz dostosować stopień, w jakim Google filtruje wyniki wyszukiwania pod kątem treści dla dorosłych. W tabeli poniżej znajdziesz ustawienia filtra SafeSearch w Google oraz ich wpływ na wyniki wyszukiwania:
| Poziom filtra SafeSearch | Opis |
|---|---|
| wysokie | Włącza bardziej rygorystyczną wersję bezpiecznego wyszukiwania. |
| medium | Blokuje strony internetowe zawierające pornografię i inne treści o charakterze seksualnym. |
| wył. | Nie filtruje treści dla dorosłych z wyników wyszukiwania. |
* Domyślne ustawienie filtra SafeSearch to wyłączony.
Jeśli masz włączony filtr SafeSearch i w wynikach wyszukiwania znajdziesz witryny zawierające obraźliwe treści, wyślij adres URL takiej witryny na adres safesearch@google.com, a my ją sprawdzimy.
Wyniki w formacie XML
- Google XML Results DTD
- Informacje o odpowiedzi XML
- XML Wyniki zwykłych i zaawansowanych zapytań
- Wyszukiwanie zwykłe/zaawansowane: przykładowe zapytanie i wynik w formacie XML
- Wyszukiwanie zwykłe i zaawansowane: tagi XML
DTD wyników XML Google
Google używa tego samego DTD do opisywania formatu XML dla wszystkich typów wyników wyszukiwania. Wiele tagów i atrybutów ma zastosowanie do wszystkich typów wyszukiwania. Niektóre tagi mają jednak zastosowanie tylko w przypadku określonych typów wyszukiwania. W konsekwencji definicje w DTD mogą być mniej restrykcyjne niż definicje podane w tym dokumencie.
W tym dokumencie opisujemy te aspekty DTD, które są istotne dla wyszukiwarki. Jeśli pracujesz nad WebSearch, możesz bezpiecznie zignorować tagi i atrybuty, które nie są tu opisane. Jeśli definicja różni się między DTD a dokumentacją, informacja o tym jest podana w tym dokumencie.
Google może zwracać wyniki XML z odwołaniem do najnowszej definicji DTD lub bez niego. Definicja DTD to przewodnik, który pomaga administratorom wyszukiwania i parserom XML zrozumieć wyniki XML Google. Gramatyka XML Google może się co jakiś czas zmieniać, dlatego nie należy konfigurować parsera tak, aby używał definicji DTD do weryfikowania każdego wyniku XML.
Nie należy też konfigurować parsera XML tak, aby pobierał DTD przy każdym przesyłaniu żądania wyszukiwania. Google rzadko aktualizuje DTD, a takie żądania powodują niepotrzebne opóźnienia i zwiększają wymagania dotyczące przepustowości.
Aby uzyskać wyniki w formacie XML, zalecamy używanie formatu wyjściowego xml_no_dtd. Jeśli w żądaniu wyszukiwania określisz format xml output, jedyną różnicą będzie włączenie do wyników XML tego wiersza:
<!DOCTYPE GSP SYSTEM "google.dtd">Najnowszą wersję DTD znajdziesz na stronie http://www.google.com/google.dtd.
Pamiętaj, że nie wszystkie funkcje w DTD mogą być obecnie dostępne lub obsługiwane.
Informacje o odpowiedzi XML
- Wszystkie wartości elementów są prawidłowym kodem HTML, który można wyświetlić, o ile w definicjach tagów XML nie podano inaczej.
- Niektóre wartości elementów to adresy URL, które przed wyświetleniem muszą zostać zakodowane w HTML-u.
- Parser XML powinien ignorować nieudokumentowane atrybuty i tagi. Dzięki temu aplikacja będzie działać bez zmian, nawet jeśli Google doda do danych wyjściowych XML więcej funkcji.
- Niektóre znaki muszą być zapisane ze zmianą znaczenia, gdy są uwzględniane jako wartości w tagach XML. Procesor XML powinien przekonwertować te encje z powrotem na odpowiednie znaki. Jeśli nie przekonwertujesz prawidłowo encji, przeglądarka może na przykład wyświetlić znak & jako „&”.
Znaki te są opisane w dokumentach XML Standard i zostały odtworzone w tabeli poniżej:
Znak Escaped Forms Jednostka Kod znaku Znak & & & & Pojedynczy cudzysłów ' ' ' Podwójny cudzysłów " " " Większe niż > > > Mniejsze niż < < <
Wyniki XML dla zwykłych i zaawansowanych zapytań
Wyszukiwanie zwykłe i zaawansowane: przykładowe zapytanie i wynik w formacie XML
To przykładowe żądanie WebSearch zawiera prośbę o 10 wyników (num=10) dla hasła „socer” (q=socer), czyli słowa „soccer” (piłka nożna) celowo napisanego błędnie na potrzeby tego przykładu.
http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i
To żądanie zwraca poniższy wynik w formacie XML. Pamiętaj, że w wyniku XML znajduje się kilka komentarzy wskazujących, gdzie pojawiają się określone tagi, które nie są uwzględnione w wyniku.
<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>
Wyszukiwanie zwykłe i zaawansowane: tagi XML
Odpowiedzi XML na zwykłe i zaawansowane żądania wyszukiwania korzystają z tego samego zestawu tagów XML. Te tagi XML są widoczne w przykładzie kodu XML powyżej i opisane w tabelach poniżej.
Tagi XML poniżej są wymienione w kolejności alfabetycznej według nazwy. Każda definicja tagu zawiera opis tagu, przykład pokazujący, jak tag wyglądałby w wyniku XML, oraz format zawartości tagu. Jeśli tag jest podrzędnym tagiem innego tagu XML lub jeśli sam ma podrzędne tagi lub atrybuty, te informacje są również podane w tabeli definicji tagu.
Obok niektórych podtagów w definicjach poniżej mogą być wyświetlane określone symbole. Znajdziesz je poniżej wraz z informacją o znaczeniu.
* = zero lub więcej wystąpień podtagu
+ = jedno lub więcej wystąpień podtagu
| A | B | P | D | P | G | H | I | L | M | N | P | P | R | S | T | X |
| anchor_text | |
|---|---|
| Definicja | Tag <anchor_text> określa tekst, który należy wyświetlać użytkownikom, aby zidentyfikować etykietę zawężenia powiązaną z zestawem wyników wyszukiwania. Etykiety zawężenia zastępują znaki inne niż alfanumeryczne podkreśleniami, więc nie należy wyświetlać wartości tagu <label> w interfejsie użytkownika. Zamiast tego należy wyświetlać wartość tagu <anchor_text>. |
| Przykład | <anchor_text>pola golfowe</anchor_text> |
| Subtag należący do | FacetItem |
| Format treści | Tekst |
| ZABLOKUJ | |
|---|---|
| Definicja | Ten tag obejmuje zawartość bloku w wierszu treści wyniku promocyjnego. Każdy blok ma podtagi T, U i L. Niepusty tag T oznacza, że blok zawiera tekst. Niepuste tagi U i L oznaczają, że blok zawiera link (z adresem URL podanym w podtagu U i tekstem kotwicy w podtagu L). |
| Subtags | T, U, L |
| Subtag należący do | BODY_LINE |
| Format treści | Pusta |
| BODY_LINE | |
|---|---|
| Definicja | Ten tag obejmuje zawartość wiersza w treści promowanego wyniku. Każdy wiersz treści składa się z kilku tagów BLOCK, które zawierają tekst lub link z adresem URL i tekstem kotwicy. |
| Subtags | BLOCK* |
| Subtag należący do | SL_MAIN |
| Format treści | Pusta |
| C | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Definicja | Tag <C> oznacza, że usługa WebSearch może pobrać wersję tego adresu URL wyniku wyszukiwania z pamięci podręcznej. Nie możesz pobierać stron z pamięci podręcznej za pomocą interfejsu XML API, ale możesz przekierowywać użytkowników na www.google.com, aby wyświetlać te treści. |
|||||||||
| Atrybuty |
|
|||||||||
| Przykład | <C SZ="6k" CID="kvOXK_cYSSgJ" /> | |||||||||
| Subtag należący do | HAS | |||||||||
| Format treści | Pusta | |||||||||
| C2C | |
|---|---|
| Definicja | Tag <C2C> oznacza, że wynik odnosi się do strony w języku chińskim tradycyjnym. Ten tag jest widoczny tylko wtedy, gdy włączona jest opcja Wyszukiwanie w języku chińskim uproszczonym i tradycyjnym. Więcej informacji o włączaniu i wyłączaniu tej funkcji znajdziesz w definicji parametru zapytania c2coff. |
| Format treści | Tekst |
| Kontekst | |
|---|---|
| Definicja | Tag <Context> zawiera listę etykiet doprecyzowujących powiązanych z zestawem wyników wyszukiwania. |
| Przykład | <Context> |
| Subtags | title, Facet+ |
| Format treści | Kontener |
| CRAWLDATE | |
|---|---|
| Definicja | Tag <CRAWLDATE> określa datę ostatniego zindeksowania strony. |
| Przykład | <CRAWLDATE>21 maja 2005 r.</CRAWLDATE> |
| Subtag należący do | R |
| Format treści | Tekst |
| DI | |
|---|---|
| Definicja | Tag <DI> zawiera informacje o kategorii Open Directory Project (ODP) dla pojedynczego wyniku wyszukiwania. |
| Przykład | <DI> |
| Subtags | DT?, DS? |
| Subtag należący do | HAS |
| Format treści | Pusta |
| DS | |
|---|---|
| Definicja | Tag <DS> zawiera podsumowanie wymienione w przypadku pojedynczej kategorii w katalogu ODP. |
| Przykład | <DS>Opublikuj swoje CV <b>piłkarza</b> bezpośrednio w internecie.</DS> |
| Subtag należący do | DI |
| Format treści | Tekst (może zawierać kod HTML) |
| Tabela danych | |
|---|---|
| Definicja | Tag <DT> zawiera tytuł pojedynczej kategorii wymienionej w katalogu ODP. |
| Przykład | <DT>SoccerConnection.net</DT> |
| Subtag należący do | DI |
| Format treści | Tekst (może zawierać HTML) |
| Aspekt | |
|---|---|
| Definicja | Tag <Facet> zawiera logiczne grupowanie tagów <FacetItem>. Możesz tworzyć te grupy za pomocą formatu specyfikacji XML wyszukiwarki Wyszukiwarki niestandardowej. Jeśli nie utworzysz tych grup, tag results_xml_tag_Context><Context> będzie zawierać maksymalnie 4 tagi <Facet>. Elementy w każdym tagu <Facet> będą grupowane na potrzeby wyświetlania, ale mogą nie mieć logicznego związku. |
| Przykład | <Facet> |
| Subtags | FacetItem+, title+ |
| Subtag należący do | Kontekst |
| Format treści | Kontener |
| FacetItem | |
|---|---|
| Definicja | Tag <FacetItem> zawiera informacje o etykiecie zawężenia powiązanej z zestawem wyników wyszukiwania. |
| Przykład | <FacetItem> |
| Subtags | label, anchor_text+ |
| Subtag należący do | Facet |
| Format treści | FacetItem |
| FI | |
|---|---|
| Definicja | Tag <FI> służy jako flaga, która wskazuje, czy w przypadku wyszukiwania przeprowadzono filtrowanie dokumentów. Więcej informacji o filtrach wyników wyszukiwania Google znajdziesz w sekcji Automatyczne filtrowanie tego dokumentu. |
| Przykład | <FI /> |
| Subtag należący do | RES |
| Format treści | Pusta |
| GSP | |||||||
|---|---|---|---|---|---|---|---|
| Definicja | Tag <GSP> obejmuje wszystkie dane zwracane w wynikach wyszukiwania Google w formacie XML. „GSP” to skrót od „Google Search Protocol” (protokół wyszukiwania Google). |
||||||
| Atrybuty |
|
||||||
| Przykład | <GSP VER="3.2"> | ||||||
| Subtags | PARAM+, Q, RES?, TM | ||||||
| Format treści | Pusta | ||||||
| HAS | |
|---|---|
| Definicja | Tag <HAS> zawiera informacje o wszystkich parametrach specjalnych żądań wyszukiwania obsługiwanych w przypadku danego adresu URL.
Uwaga: definicja elementu <HAS> w przypadku wyszukiwania w internecie jest bardziej restrykcyjna niż w DTD. |
| Subtags | DI?, L?, C? RT? |
| Subtag należący do | R |
| ISURL | |
|---|---|
| Definicja | Jeśli powiązane zapytanie jest adresem URL, Google zwraca tag <ISURL>. |
| Subtag należący do | GSP |
| Format treści | Pusta |
| L | |
|---|---|
| Definicja | Obecność tagu <L> oznacza, że usługa WebSearch może znaleźć inne witryny, które zawierają linki do tego adresu URL wyniku wyszukiwania. Aby znaleźć takie witryny, użyj specjalnego terminu zapytania link:. |
| Subtag należący do | HAS |
| Format treści | Pusta |
| etykieta | |
|---|---|
| Definicja | Tag <label> określa etykietę zawężenia, której możesz użyć do filtrowania otrzymywanych wyników wyszukiwania. Aby użyć etykiety zawężania, dodaj ciąg znaków more:[[label tag value]] do wartości parametru q w żądaniu HTTP wysyłanym do Google, jak pokazano w przykładzie poniżej. Pamiętaj, że przed wysłaniem zapytania do Google musisz zastosować do tej wartości kodowanie URL. This example uses the refinement label golf_courses to Uwaga: tag <label> nie jest tym samym co tag <Label>, który identyfikuje etykietę zawężenia powiązaną z określonym adresem URL w wynikach wyszukiwania. |
| Przykład | <label>golf_courses</label> |
| Subtag należący do | FacetItem |
| Format treści | Tekst |
| LANG | |
|---|---|
| Definicja | Tag <LANG> zawiera najbardziej prawdopodobny język wyniku wyszukiwania określony przez Google. |
| Przykład | <LANG>en</LANG> |
| Subtag należący do | R |
| Format treści | Tekst |
| M | |
|---|---|
| Definicja | Tag <M> określa szacowaną łączną liczbę wyników wyszukiwania. Uwaga: ta szacunkowa wartość może być niedokładna. |
| Przykład | <M>16200000</M> |
| Subtag należący do | RES |
| Format treści | Tekst |
| NB | |
|---|---|
| Definicja | Tag <NB> zawiera informacje o nawigacji – linki do następnej lub poprzedniej strony wyników wyszukiwania – dla zestawu wyników. Uwaga: ten tag jest widoczny tylko wtedy, gdy dostępnych jest więcej wyników. |
| Przykład | <NB> |
| Subtags | NU?, PU? |
| Subtag należący do | RES |
| Format treści | Pusta |
| NU | |
|---|---|
| Definicja | Tag <NU> zawiera link względny do następnej strony wyników wyszukiwania. |
| Przykład | <NU>/search?q=flowers&num=10&hl=en&ie=UTF-8 &output=xml&client=test&start=10</NU> |
| Subtag należący do | NB |
| Format treści | Tekst (względny URL) |
| PARAM | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Definicja | Tag <PARAM> identyfikuje parametr wejściowy przesłany w żądaniu HTTP powiązanym z wynikiem XML. Informacje o parametrze znajdują się w atrybutach tagu: name, value, original_value. Dla każdego parametru przesłanego w żądaniu HTTP będzie istniał jeden tag PARAM. |
||||||||||||
| Atrybuty |
|
||||||||||||
| Przykład | <PARAM name="cr" value="countryNZ" original_value="countryNZ" /> | ||||||||||||
| Subtag należący do | GSP | ||||||||||||
| Format treści | Złożony | ||||||||||||
| PU | |
|---|---|
| Definicja | Tag <PU> zawiera link względny do poprzedniej strony wyników wyszukiwania. |
| Przykład | <PU>/search?q=flowers&num=10&hl=en&output=xml &client=test&start=10</PU> |
| Subtag należący do | NB |
| Format treści | Tekst (względny URL) |
| Q | |
|---|---|
| Definicja | Tag <Q> identyfikuje wyszukiwane hasło przesłane w żądaniu HTTP powiązanym z wynikiem XML. |
| Przykład | <Q>pizza</Q> |
| Subtag należący do | GSP |
| Format treści | Tekst |
| R | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Definicja | Tag <R> zawiera szczegóły pojedynczego wyniku wyszukiwania. Uwaga: definicja tagu <R> w przypadku wyszukiwania w internecie jest bardziej restrykcyjna niż w DTD. |
|||||||||
| Atrybuty |
|
|||||||||
| Subtags | U, UE, T?, CRAWLDATE, S?, LANG?, HAS | |||||||||
| Subtag należący do | RES | |||||||||
| RES | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Definicja | Tag <RES> obejmuje zestaw poszczególnych wyników wyszukiwania i szczegóły dotyczące tych wyników. |
|||||||||
| Atrybuty |
|
|||||||||
| Przykład | <RES SN="1" EN="10"> | |||||||||
| Subtags | M, FI?, XT?, NB?, R* | |||||||||
| Subtag należący do | GSP | |||||||||
| Format treści | Pusta | |||||||||
| S | |
|---|---|
| Definicja | Tag <S> zawiera fragment wyniku wyszukiwania, w którym wyszukiwane hasła są wyróżnione pogrubieniem. W wyciągu uwzględniono podziały wierszy, aby tekst był prawidłowo zawijany. |
| Przykład | <S>Waszyngton (CNN) – Propozycja zakończenia impasu w Senacie w sprawie kandydatów do sądu zaproponowanych przez prezydenta <b>Busha</b> pozwoliłaby na przejście 5 nominowanych do głosowania końcowego przy zachowaniu <b>…<b>…</b><S> |
| Subtag należący do | R |
| Format treści | Tekst (HTML) |
| SL_MAIN | |
|---|---|
| Definicja | Ten tag zawiera treść wyniku promocyjnego. Używaj go do analizowania promocji. Tekst kotwicy i adres URL linku z tytułem znajdują się odpowiednio w tagach podrzędnych T i U. Wiersze tekstu i linki znajdują się w tagach podrzędnych BODY_LINE. |
| Subtags | BODY_LINE*, T, U |
| Subtag należący do | SL_RESULTS |
| Format treści | Pusta |
| SL_RESULTS | |
|---|---|
| Definicja | Tag w kontenerze w przypadku promowanych wyników. Jeden z nich będzie się pojawiać, gdy w wynikach wyszukiwania znajdzie się promocja. Podtag SL_MAIN zawiera główne dane wyników. |
| Subtags | SL_MAIN* |
| Subtag należący do | R |
| Format treści | Pusta |
| Pisownia | |
|---|---|
| Definicja | Tag <Spelling> zawiera alternatywną sugestię pisowni przesłanego zapytania. Ten tag pojawia się tylko na pierwszej stronie wyników wyszukiwania. Sugestie pisowni są dostępne w języku angielskim, chińskim, japońskim i koreańskim. Uwaga: Google zwraca sugestie pisowni tylko w przypadku zapytań, w których wartość parametru gl jest zapisana małymi literami. |
| Przykład | <Spelling> |
| Subtags | Sugestia |
| Subtag należący do | GSP |
| Format treści | Pusta |
| Sugestia | |||||||
|---|---|---|---|---|---|---|---|
| Definicja | Tag <Suggestion> zawiera sugestię pisowni dla przesłanego zapytania. Możesz użyć treści tagu , aby zasugerować użytkownikowi wyszukiwarki alternatywną pisownię. Wartość atrybutu q to sugestia pisowni zakodowana w formacie URL, której możesz użyć jako terminu wyszukiwania. | ||||||
| Atrybuty |
|
||||||
| Przykład | <Suggestion q="soccer"><b><i>soccer</i></b></Suggestion> | ||||||
| Subtag należący do | Pisownia | ||||||
| Format treści | Tekst (HTML) | ||||||
| T | |
|---|---|
| Definicja | Tag <T> zawiera tytuł wyniku. |
| Przykład | <T>Amici's East Coast Pizzeria</T> |
| Subtag należący do | R |
| Format treści | Tekst (HTML) |
| tytuł | |
|---|---|
| Definicja | Tag <title>, będący elementem podrzędnym tagu <Context>, zawiera nazwę Twojej wyszukiwarki niestandardowej. Tag <title>, jako element podrzędny tagu <Facet>, określa tytuł zestawu aspektów. |
| Przykład | Jako element podrzędny tagu <Context>: <title>Moja wyszukiwarka</title> Jako element podrzędny elementu <Facet>: <title>facet title</title> |
| Subtag należący do | Context, Facet |
| Format treści | Tekst |
| TM | |
|---|---|
| Definicja | Tag <TM> określa łączny czas serwera potrzebny do zwrócenia wyników wyszukiwania, mierzony w sekundach. |
| Przykład | <TM>0.100445</TM> |
| Subtag należący do | GSP |
| Format treści | Tekst (liczba zmiennoprzecinkowa) |
| TT | |
|---|---|
| Definicja | Tag <TT> zawiera wskazówkę dotyczącą wyszukiwania. |
| Przykład | <TT><i>Wskazówka: w większości przeglądarek naciśnięcie klawisza Enter daje takie same wyniki jak kliknięcie przycisku Szukaj.</i></TT> |
| Subtag należący do | GSP |
| U | |
|---|---|
| Definicja | Tag <U> zawiera adres URL wyniku wyszukiwania. |
| Przykład | <U>http://www.dominos.com/</U> |
| Subtag należący do | R |
| Format treści | Tekst (bezwzględny URL) |
| UD | |
|---|---|
| Definicja | Tag <UD> zawiera adres URL zakodowany w IDN (międzynarodowej nazwie domeny) dla wyniku wyszukiwania. Ta wartość umożliwia wyświetlanie domen w językach lokalnych. Na przykład adres URL zakodowany w formacie IDN http://www.%E8%8A%B1%E4%BA%95.com może zostać zdekodowany i wyświetlony jako http://www.花井鮨.com. Ten tag <UD> będzie uwzględniany tylko w wynikach wyszukiwania w przypadku żądań, które zawierały parametr ud. Uwaga: jest to funkcja beta. |
| Przykład | <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD> |
| Subtag należący do | R |
| Format treści | Tekst (zakodowany URL IDN) |
| UE | |
|---|---|
| Definicja | Tag <UE> zawiera adres URL wyniku wyszukiwania. Wartość jest zakodowana na potrzeby adresu URL, dzięki czemu można ją przekazywać jako parametr zapytania w adresie URL. |
| Przykład | <UE>http://www.dominos.com/</UE> |
| Subtag należący do | R |
| Format treści | Tekst (URL z kodowaniem URL) |
| XT | |
|---|---|
| Definicja | Tag <XT> oznacza, że szacunkowa łączna liczba wyników określona przez tag M jest w rzeczywistości dokładną łączną liczbą wyników. Więcej informacji znajdziesz w sekcji Automatyczne filtrowanie w tym dokumencie. |
| Przykład | <XT /> |
| Subtag należący do | RES |
| Format treści | Pusta |
Wyniki XML dla zapytań dotyczących wyszukiwania obrazów
Przykładowe żądanie dotyczące obrazu zawiera prośbę o 5 wyników (num=5) dla wyszukiwanego hasła „małpa” (q=monkey).
http://www.google.com/cse? searchtype=image &num=2 &q=monkey &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
To żądanie zwraca poniższy wynik w formacie XML.
<GSP VER="3.2">
<TM>0.395037</TM>
<Q>monkeys</Q>
<PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
<PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
<PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
<PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
<PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
<PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
<PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
<PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
<PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>
<Context>
<title>domestigeek</title>
</Context>
<ARES/>
<RES SN="1" EN="2">
<M>2500000</M>
<NB>
<NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
&ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
</NU>
</NB>
<RG START="1" SIZE="2"/>
<R N="1" MIME="image/jpeg">
<RU>http://www.flickr.com/photos/fncll/135465558/</RU>
<U>
http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
</U>
<UE>
http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
</UE>
<T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
<RK>0</RK>
<BYLINEDATE>1146034800</BYLINEDATE>
<S>Computer <b>Monkeys</b> | Flickr</S>
<LANG>en</LANG>
<IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
<SZ>88386</SZ>
<IN/>
</IMG>
<TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
</R>
<R N="2" MIME="image/jpeg">
<RU>
http://www.flickr.com/photos/flickerbulb/187044366/
</RU>
<U>
http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
</U>
<UE>
http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
</UE>
<T>
one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
</T>
<RK>0</RK>
<BYLINEDATE>1152514800</BYLINEDATE>
<S>one. ugly. <b>monkey</b>.</S>
<LANG>en</LANG>
<IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
EF4tQQnDDKOq0"><SZ>58339</SZ>
<IN/>
</IMG>
<TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
</R>
</RES>
</GSP>Wyszukiwarka obrazów: tagi XML
W tabeli poniżej znajdziesz dodatkowe tagi XML używane w odpowiedziach XML na zapytania w wyszukiwaniu obrazów.
Obok niektórych podtagów w definicjach poniżej mogą być wyświetlane określone symbole. Znajdziesz je poniżej wraz z informacją o znaczeniu.
* = zero lub więcej wystąpień podtagu
+ = jedno lub więcej wystąpień podtagu
| RG | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Definicja | Tag <RG> zawiera szczegóły pojedynczego wyniku wyszukiwania obrazów. |
|||||||||
| Atrybuty |
| |||||||||
| Subtag należący do | RES | |||||||||
| RU | |
|---|---|
| Definicja | Tag <RU tag> zawiera szczegóły każdego wyniku wyszukiwania obrazów. |
| Subtag należący do | R |