Informacje o danych i zapytaniach w Statystykach miejsc

Dane Statystyk miejsc

Statystyki miejsc udostępniają pełne i przykładowe zbiory danych w BigQuery.

Przykładowe zbiory danych mają na celu umożliwienie Ci wypróbowania Statystyk miejsc, aby ocenić użyteczność i wartość tego produktu przed podjęciem decyzji o zakupie pełnego zbioru danych. Przykładowy zbiór danych zawiera tylko dane dotyczące samego miasta. Nie zawiera danych dotyczących okolicznej aglomeracji.

Przykładowa lista zawiera dane dotyczące największego miasta w każdym z obsługiwanych krajów:

Amsterdam (NL) Helsinki (FI) Płowdiw (BG)
Ankara (TR) Hongkong (HK) Ar-Rifa (BH)
Arequipa (PE) Dżakarta (ID) Rzym (IT)
Ateny (GR) Dżudda (SA) Santiago (CL)
Bad Gastein (AT) Johannesburg (ZA) São Paulo (BR)
Berlin (DE) Kuala Lumpur (MY) Szardża (AE)
Brno (CZ) Lizbona (PT) Singapur (SG)
Bruksela (BE) Londyn (GB) Sztokholm (SE)
Bukareszt (RO) Lusail (QA) Sydney (AU)
Buenos Aires (AR) Madryt (ES) Tajpej (TW)
Pusan (KR) Manila (PH) Tel Awiw-Jafa (IL)
Kair (EG) Medellín (CO) Tokio (JP)
Chiang Mai (TH) Meksyk (MX) Toronto (CA)
Kopenhaga (DK) Mumbaj (IN) Warszawa (PL)
Cork (IE) Nowy Jork (US) Wellington (NZ)
Debreczyn (HU) Oslo (NO) Zurych (CH)
Hanoi (VN) Paryż (FR)

Pełne zbiory danych zawierają dane dotyczące każdego obsługiwanego kraju i trzeba je kupić. Jeśli chcesz zarejestrować się w Statystykach miejsc, wypełnij formularz zgłoszenia. Tylko subskrybent danych musi poprosić o dostęp do zbioru danych Statystyk miejsc. Gdy subskrypcja jest aktywna w projekcie BigQuery, każdy użytkownik mający dostęp do tego projektu może wysyłać zapytania do danych Statystyk miejsc.

Każdy zbiór danych dotyczący kraju ma własną listę, którą musisz subskrybować osobno. Więcej informacji o subskrybowaniu listy znajdziesz w artykule Konfigurowanie Statystyk miejsc.

Schematy zbiorów danych

Schemat zbioru danych miejsc dla każdego kraju składa się z 2 części:

Jeśli na przykład pracujesz ze zbiorem danych dla Hiszpanii (ES), odwołuj się zarówno do schematu podstawowego, jak i do schematu specyficznego dla Hiszpanii.

Schemat zbioru danych marek określa 3 pola:

  • id: identyfikator marki.
  • name: nazwa marki, np. „Hertz” lub „Chase”.
  • category: kategoria najwyższego poziomu marki, np. „Stacja benzynowa”, „Jedzenie i napoje” lub „Obiekty noclegowe”.

Wysyłanie zapytań do danych Statystyk miejsc

Statystyki miejsc oferują 2 sposoby wysyłania zapytań do zbiorów danych:

  • Wysyłanie zapytań do zbioru danych bezpośrednio za pomocą SQL: wykonuj standardowe zapytania SQL BigQuery w tabelach zbioru danych. Zapewnia to największą elastyczność w przypadku złożonego filtrowania, łączenia z własnymi danymi, analiz niestandardowych i obsługi dodatkowych funkcji agregacji poza COUNT, takich jak AVG, SUM i GROUP BY. Zapoznaj się z dokumentacją.
  • Wysyłanie zapytań do zbioru danych za pomocą funkcji Places Count: funkcje Places Count to predefiniowane, zoptymalizowane zapytania SQL, które są wykonywane bezpośrednio w BigQuery i upraszczają typowe zadania pobierania danych. Umożliwiają uzyskanie bardziej szczegółowych statystyk, np. zwracają identyfikatory miejsc, aby można było wyszukać szczegóły dotyczące poszczególnych miejsc. Zapoznaj się zdokumentacją.

Zapytania bezpośrednie

Bezpośrednie wysyłanie zapytań do danych wymusza próg agregacji. Wynik jest zwracany tylko wtedy, gdy zapytanie agreguje co najmniej 5 miejsc. Jeśli na przykład kryteria wyszukiwania dają wynik 0, 1, 2, 3 lub 4, wynik jest pomijany w odpowiedzi. Na przykład zapytanie o łączną liczbę restauracji w danym obszarze zwróci odpowiedź tylko wtedy, gdy łączna liczba wynosi co najmniej 5. W przeciwnym razie nie zostanie zwrócona żadna odpowiedź.

Zapytania do funkcji Places Count

Funkcje Places Count mogą zwracać listę identyfikatorów miejsc, których można użyć do wyszukiwania informacji o poszczególnych miejscach za pomocą innych usług GMP, takich jak Places API i Places UI Kit.

Funkcje Places Count nie wymuszają progu agregacji, ale zamiast tego wymuszają minimalny obszar wyszukiwania o wymiarach 40,0 m na 40,0 m (1600 m2). Oznacza to, że dopóki zapytanie jest większe niż minimalny obszar wyszukiwania, zawsze otrzymasz wynik, nawet jeśli nie ma miejsc pasujących do zapytania.

Kiedy wysyłać zapytania do danych bezpośrednio, a kiedy używać funkcji

Wysyłaj zapytania do danych bezpośrednio, jeśli nie potrzebujesz niskich wyników, chcesz uzyskać statystyki wykraczające poza liczbę, takie jak AVG, SUM lub COUNTIF, albo jeśli musisz wykonywać bardziej złożone zapytania, np. łączyć zbiory danych.

Wysyłaj zapytania za pomocą funkcji, jeśli musisz wiedzieć, czy liczba wyników jest niska lub wynosi 0, albo jeśli musisz pobrać informacje o poszczególnych miejscach, takie jak nazwa lub adres.

W tej tabeli znajdziesz szczegółowe porównanie różnic między zapytaniami bezpośrednimi a funkcjami Places Count.

Funkcje Places Count Bezpośrednie zapytania do zbioru danych
Korzyści
  • Zwraca identyfikatory miejsc, których można używać do wysyłania zapytań do innych interfejsów API.
  • Może zwracać dowolną liczbę.
  • Zoptymalizowane pod kątem wydajności i niskich kosztów przetwarzania.
  • Łatwe w użyciu. Nie musisz pisać złożonych zapytań.
  • Sprawdza parametry wejściowe i zwraca błąd, co ułatwia korzystanie i debugowanie.
  • Umożliwia wykonywanie złożonych zapytań, takich jak zaawansowane filtrowanie i łączenie.
  • Nie wymusza minimalnego obszaru wyszukiwania.
  • Obsługuje dodatkowe funkcje agregacji poza COUNT, takie jak AVG, SUM i GROUP BY.
Interfejs 4 predefiniowane funkcje SQL, które generują statystyki COUNT: pojedyncza liczba, liczba według typu, liczba według lokalizacji geograficznej, liczba według komórki H3. JSON_OBJECT przekazuje argumenty do funkcji. Napisz własny kod SQL, aby uruchamiać funkcje agregacji, takie jak COUNT, COUNT_IF, SUM i AVG.. Dodatkowe statystyki można generować za pomocą funkcji JOIN, GROUP BY, WHERE i innych.
Ograniczenia Wymusza minimalny obszar wyszukiwania o wymiarach 40,0 m na 40,0 m (1600 m2). Funkcja zwraca wynik nawet wtedy, gdy liczba agregacji jest mniejsza niż 5, o ile spełniony jest minimalny obszar wyszukiwania. Wyniki z liczbą mniejszą niż 5 są pomijane (tzn. wiersz jest wykluczany).
Obsługiwane filtry atrybutów Parametry filtrów funkcji Places Count obsługują te same filtry atrybutów co zapytania bezpośrednie, z wyjątkiem:
  • id miejsca
  • Komponenty adresu
  • Godziny otwarcia
  • Opcje ładowania pojazdów elektrycznych
  • Marki
Obsługiwany jest pełny schemat.