Łącznik treści to program, który służy do przeglądania danych w repozytorium przedsiębiorstwa i wypełniania źródła danych. Google udostępnia te opcje tworzenia łączników treści:
Pakiet SDK Content Connector. Jest to dobre rozwiązanie, jeśli programujesz w języku Java. Pakiet SDK Content Connector to opakowanie interfejsu API REST, które umożliwia szybkie tworzenie połączeń. Aby utworzyć oprogramowanie sprzęgające treści za pomocą pakietu SDK, zapoznaj się z artykułem Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector.
interfejs API REST niskiego poziomu lub biblioteki API; Użyj tych opcji, jeśli nie programujesz w języku Java lub jeśli Twój kod źródłowy lepiej pasuje do interfejsu REST API lub biblioteki. Aby utworzyć oprogramowanie sprzęgające treści za pomocą interfejsu API REST, zapoznaj się z artykułem Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST.
Typowy łącznik treści wykonuje te zadania:
- Czyta i przetwarza parametry konfiguracji.
- Pobiera z zewnętrznego repozytorium treści poszczególne fragmenty danych, które można indeksować, zwane „elementami”.
- Łączy listy kontroli dostępu, metadane i dane treści w elementy indeksowane.
- Indeksuje elementy w źródle danych Cloud Search.
- (opcjonalnie) Słucha powiadomień o zmianach w repozytorium treści zewnętrznych. Powiadomienia o zmianach są przekształcane w żądania indeksowania, aby źródło danych Cloud Search było zsynchronizowane z repozytorium innej firmy. Konwerter wykonuje to zadanie tylko wtedy, gdy repozytorium obsługuje wykrywanie zmian.
Tworzenie łącznika treści za pomocą pakietu SDK Content Connector
W kolejnych sekcjach opisujemy, jak utworzyć oprogramowanie sprzęgające treści za pomocą pakietu SDK oprogramowania sprzęgającego treści.
Konfigurowanie zależności
Aby korzystać z pakietu SDK, musisz uwzględnić w pliku kompilacji określone zależności. Aby wyświetlić zależności środowiska kompilacji:
Maven
<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>
Gradle
compile group: 'com.google.enterprise.cloudsearch',
name: 'google-cloudsearch-indexing-connector-sdk',
version: 'v1-0.0.3'
Tworzenie konfiguracji oprogramowania sprzęgającego
Każdy łącznik ma plik konfiguracji zawierający parametry używane przez ten łącznik, takie jak identyfikator repozytorium. Parametry są definiowane jako pary klucz-wartość, np. api.sourceId=1234567890abcdef
.
Pakiet SDK Google Cloud Search zawiera kilka parametrów konfiguracji dostarczonych przez Google, które są używane przez wszystkie oprogramowania sprzęgające. W pliku konfiguracyjnym musisz zadeklarować te parametry dostarczane przez Google:
- W przypadku łącznika treści musisz zadeklarować parametry
api.sourceId
iapi.serviceAccountPrivateKeyFile
, ponieważ wskazują one lokalizację repozytorium i klucz prywatny potrzebny do uzyskania dostępu do repozytorium.
- W przypadku łącznika tożsamości musisz zadeklarować parametr
api.identitySourceId
, ponieważ wskazuje on lokalizację zewnętrznego źródła tożsamości. Jeśli synchronizujesz użytkowników, musisz też zadeklarowaćapi.customerId
jako unikalny identyfikator konta Google Workspace Twojej firmy.
O ile nie chcesz zastąpić domyślnych wartości innych parametrów dostarczanych przez Google, nie musisz ich deklarować w pliku konfiguracyjnym. Więcej informacji o parametrach konfiguracji udostępnianych przez Google, np. o generowaniu określonych identyfikatorów i kluczy, znajdziesz w artykule Parametry konfiguracji udostępniane przez Google.
Możesz też zdefiniować własne parametry repozytorium, które będą używane w pliku konfiguracyjnym.
Przekazywanie pliku konfiguracji do oprogramowania sprzęgającego
Ustaw właściwość systemową config
, aby przekazać plik konfiguracji do łącznika. Podczas uruchamiania łącznika możesz ustawić tę właściwość za pomocą argumentu -D
. Na przykład to polecenie uruchamia łącznik za pomocą pliku konfiguracji MyConfig.properties
:
java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector
Jeśli ten argument jest nieobecny, pakiet SDK próbuje uzyskać dostęp do domyślnego pliku konfiguracji o nazwie connector-config.properties
.
Określanie strategii przeszukiwania
Podstawową funkcją łącznika treści jest przeszukiwanie repozytorium i indeksowanie jego danych. Musisz zastosować strategię przeszukiwania na podstawie rozmiaru i układu danych w repozytorium. Możesz zaprojektować własną strategię lub wybrać jedną z tych implementowanych w pakiecie SDK:
- Strategia pełnego przeszukiwania
Strategia pełnego przeszukiwania skanuje całe repozytorium i indeksuje wszystkie elementy. Ta strategia jest często stosowana, gdy masz małą repozytorię i możesz sobie pozwolić na obciążenie związane z pełnym przeszukiwaniem za każdym razem, gdy indeksujesz.
Ta strategia przeszukiwania jest odpowiednia w przypadku małych repozytoriów z głównie statycznymi, niehierarchicznymi danymi. Możesz też użyć tej strategii przeszukiwania, gdy wykrywanie zmian jest trudne lub nieobsługiwane przez repozytorium.
- List traversal strategy
Strategia przeszukiwania listy skanuje całe repozytorium, w tym wszystkie węzły podrzędne, określając stan każdego elementu. Następnie oprogramowanie sprzęgające wykonuje drugi pass i indeksuje tylko elementy, które są nowe lub zostały zaktualizowane od czasu ostatniego indeksowania. Ta strategia jest często stosowana do wykonywania przyrostowych aktualizacji istniejącego indeksu (zamiast pełnego przeszukiwania za każdym razem, gdy indeks jest aktualizowany).
Ta strategia przeszukiwania jest odpowiednia, gdy wykrywanie zmian jest trudne lub nieobsługiwane przez repozytorium, gdy masz dane niehierarchiczne i pracujesz z bardzo dużymi zbiorami danych.
- Przeglądanie grafu
Strategia przeszukiwania grafu skanuje cały węzeł nadrzędny, aby określić stan każdego elementu. Następnie oprogramowanie sprzęgające wykonuje drugi przejazd i indeksuje tylko te elementy w węźle głównym, które są nowe lub zostały zaktualizowane od czasu ostatniego indeksowania. Na koniec usługa przekazuje wszystkie identyfikatory elementów podrzędnych, a następnie indeksuje elementy w węzłach podrzędnych, które są nowe lub zostały zaktualizowane. Połączenie przechodzi rekurencyjnie przez wszystkie węzły podrzędne, dopóki nie zostaną przetworzone wszystkie elementy. Takie przeszukiwanie jest zwykle używane w przypadku repozytoriów hierarchicznych, w których wyświetlanie wszystkich identyfikatorów nie jest praktyczne.
Ta strategia jest odpowiednia, jeśli masz dane hierarchiczne, które wymagają zindeksowania, np. serię katalogów lub stron internetowych.
Każda z tych strategii przeszukiwania jest implementowana przez klasę łącznika szablonu w pakiecie SDK. Możesz zastosować własną strategię przeszukiwania, ale te szablony znacznie przyspieszą rozwój łącznika. Aby utworzyć łącznik za pomocą szablonu, przejdź do sekcji odpowiadającej Twojej strategii przeszukiwania:
- Tworzenie pełnego łącznika przeszukiwania za pomocą klasy szablonu
- Tworzenie łącznika do przeszukiwania list za pomocą klasy szablonu
- Tworzenie oprogramowania sprzęgającego do przechodzenia po grafie za pomocą klasy szablonu
Tworzenie pełnego łącznika przeszukiwania za pomocą klasy szablonu
Ta sekcja dokumentów odnosi się do fragmentów kodu z pliku FullTraversalSample.
Implementacja punktu wejścia oprogramowania sprzęgającego
Punkt wejścia do łącznika to metoda main()
. Głównym zadaniem tej metody jest utworzenie instancji klasy Application
i wywołanie jej metody start()
, aby uruchomić oprogramowanie sprzęgające.
Zanim wywołasz funkcję
application.start()
,
użyj klasy
IndexingApplication.Builder
do utworzenia instancji szablonu
FullTraversalConnector
. Funkcja FullTraversalConnector
przyjmuje obiekt Repository
, którego metody implementujesz. Ten fragment kodu pokazuje, jak zastosować metodę main()
:
W tle pakiet SDK wywołuje metodę initConfig()
, gdy metoda main()
w konektorze wywołuje metodę Application.build
.
Metoda initConfig()
wykonuje te zadania:
- Wywołuje metodę
Configuation.isInitialized()
, aby sprawdzić, czy nie została zainicjowana metodaConfiguration
. - Inicjuje obiekt
Configuration
za pomocą par klucz-wartość dostarczonych przez Google. Każda para klucz-wartość jest przechowywana w obiekcieConfigValue
w obiekcieConfiguration
.
Zaimplementuj interfejs Repository
.
Jedynym celem obiektu Repository
jest przeszukiwanie i indeksowanie elementów repozytorium. Aby utworzyć łącznik treści, wystarczy zastąpić określone metody w interfejsie Repository
. Metody, które zastąpisz, zależą od używanego szablonu i strategii przeszukiwania. W przypadku pola FullTraversalConnector
zastąpij te metody:
metoda
init()
. Aby przeprowadzić konfigurację i inicjalizację repozytorium danych, zastąpij metodęinit()
.metoda
getAllDocs()
. Aby przejść przez wszystkie elementy w repozytorium danych i z nich wygenerować indeks, zastąpij metodęgetAllDocs()
. Ta metoda jest wywoływana raz dla każdego zaplanowanego przejścia (zgodnie z konfiguracją).(Opcjonalnie) metoda
getChanges()
. Jeśli repozytorium obsługuje wykrywanie zmian, zastąpij metodęgetChanges()
. Ta metoda jest wywoływana raz dla każdej zaplanowanej iteracyjnej iteracji (zgodnie z konfiguracją), aby pobrać zmodyfikowane elementy i je zindeksować.(Opcjonalnie) metoda
close()
. Jeśli musisz wyczyścić repozytorium, zastąpij metodęclose()
. Ta metoda jest wywoływana raz podczas zamykania łącznika.
Każda z metod obiektu Repository
zwraca obiekt typu ApiOperation
. Obiekt ApiOperation
wykonuje działanie w postaci pojedynczego lub wielu wywołań IndexingService.indexItem()
, aby przeprowadzić faktyczne indeksowanie repozytorium.
Pobieranie parametrów konfiguracji niestandardowej
W ramach obsługi konfiguracji łącznika musisz pobrać wszystkie parametry niestandardowe z obiektu Configuration
. Zwykle jest to wykonywane w ramach metody Repository
klasy init()
.
Klasa Configuration
udostępnia kilka metod umożliwiających pobieranie różnych typów danych z konfiguracji. Każda metoda zwraca obiekt ConfigValue
. Następnie użyjesz metody get()
obiektu ConfigValue
, aby pobrać rzeczywistą wartość.
Ten fragment kodu z FullTraversalSample
pokazuje, jak pobrać jedną niestandardową wartość całkowitą z obiektu Configuration
:
Aby pobrać i przeanalizować parametr zawierający kilka wartości, użyj jednego z analizatorów typu klasy Configuration
, aby przeanalizować dane na oddzielne fragmenty.
Ten fragment kodu z samouczka używa metody getMultiValue
do uzyskania listy nazw repozytoriów GitHub:
Przeprowadź pełne przeszukiwanie
ZastąpićgetAllDocs()
, aby przeprowadzić pełne przejście i zaindeksować repozytorium. Metoda getAllDocs()
przyjmuje punkt kontrolny. Punkt kontrolny służy do wznowienia indeksowania w przypadku przerwania procesu. W przypadku każdego elementu w Twoim repozytorium wykonaj te czynności w ramach metody getAllDocs()
:
- Ustaw uprawnienia.
- Ustaw metadane dla indeksowanego elementu.
- Połącz metadane i element w jeden indeksowalny element.
RepositoryDoc
- Zawijaj każdy indeksowalny element w iterator zwracany przez metodę
getAllDocs()
. Pamiętaj, żegetAllDocs()
zwraca obiektCheckpointCloseableIterable
, który jest iteracją obiektówApiOperation
. Każdy z nich reprezentuje żądanie interfejsu API wykonane naRepositoryDoc
, np. indeksowanie.
Jeśli zbiór elementów jest zbyt duży, aby przetworzyć go w pojedynczym wywołaniu, dodaj punkt kontrolny i ustaw parametr hasMore(true)
, aby wskazać, że więcej elementów jest dostępnych do indeksowania.
Ustawianie uprawnień dotyczących elementu
Repozytorium używa listy kontroli dostępu (ACL) do identyfikowania użytkowników lub grup, które mają dostęp do elementu. Lista ACL to lista identyfikatorów grup lub użytkowników, którzy mają dostęp do elementu.
Musisz powielić reguły ACL używane przez repozytorium, aby mieć pewność, że tylko użytkownicy z dostępem do danego elementu będą mogli go zobaczyć w wynikach wyszukiwania. Podczas indeksowania elementu należy uwzględnić listę ACL elementu, aby Google Cloud Search miał informacje potrzebne do zapewnienia odpowiedniego poziomu dostępu do tego elementu.
Pakiet SDK Content Connector udostępnia bogaty zestaw klas i metod ACL, które umożliwiają modelowanie list ACL większości repozytoriów. Podczas indeksowania elementu musisz przeanalizować listę ACL każdego elementu w repozytorium i utworzyć odpowiednią listę ACL dla Google Cloud Search. Jeśli lista ACL repozytorium korzysta z takich pojęć jak dziedziczenie listy ACL, modelowanie tej listy może być trudne. Więcej informacji o regułach dostępu w Google Cloud Search znajdziesz w artykule Reguły dostępu w Google Cloud Search.
Uwaga: interfejs Cloud Search Indexing API obsługuje uprawnienia ACL dla jednej domeny. Nie obsługuje list ACL między domenami. Użyj klasy Acl.Builder
, aby ustawić dostęp do poszczególnych elementów za pomocą listy kontroli dostępu. Poniższy fragment kodu, pochodzący z pełnego przykładu przeglądania, umożliwia wszystkim użytkownikom lub „podmiotom” (getCustomerPrincipal()
) stać się „czytnikami” wszystkich elementów (.setReaders()
) podczas wyszukiwania.
Aby prawidłowo modelować listy kontroli dostępu w repozytorium, musisz je dobrze rozumieć. Na przykład możesz indeksować pliki w systemie plików, który używa modelu dziedziczenia, w którym foldery podrzędne dziedziczą uprawnienia z folderów nadrzędnych. Modelowanie dziedziczenia uprawnień wymaga dodatkowych informacji opisanych w artykule Uprawnienia dostępu w Google Cloud Search.
Ustawianie metadanych produktu
Metadane są przechowywane w obiekcie Item
. Aby utworzyć element Item
, musisz podać co najmniej unikalny identyfikator ciągu znaków, typ elementu, listę ACL, adres URL i wersję elementu.
Ten fragment kodu pokazuje, jak utworzyć obiekt Item
za pomocą klasy pomocniczej IndexingItemBuilder
.
Tworzenie elementu podlegającego indeksowaniu
Po ustawieniu metadanych elementu możesz utworzyć rzeczywisty indeksowalny element za pomocą klasy RepositoryDoc.Builder
. W tym przykładzie pokazujemy, jak utworzyć pojedynczy indeksowalny element.
RepositoryDoc
to typ ApiOperation
, który wykonuje rzeczywiste żądanie IndexingService.indexItem()
.
Możesz też użyć metody setRequestMode()
klasy RepositoryDoc.Builder
, aby zidentyfikować żądanie indeksowania jako ASYNCHRONOUS
lub SYNCHRONOUS
:
ASYNCHRONOUS
- Tryb asynchroniczny powoduje dłuższy czas od indeksowania do wyświetlania i umożliwia stosowanie dużego limitu przepustowości dla żądań indeksowania. Tryb asynchroniczny jest zalecany do początkowego indeksowania (uzupełniania) całego repozytorium.
SYNCHRONOUS
- Tryb synchroniczny powoduje krótsze opóźnienie między indeksowaniem a wyświetlaniem i umożliwia korzystanie z ograniczonej puli przepustowości. Tryb synchroniczny jest zalecany do indeksowania aktualizacji i zmian w repozytorium. Jeśli nie określisz trybu żądania, zostanie użyte ustawienie domyślne
SYNCHRONOUS
.
Pakowanie każdego indeksowalnego elementu w iteratorze
Metoda getAllDocs()
zwraca obiekt Iterator
, a w szczególności CheckpointCloseableIterable
obiektów RepositoryDoc
. Aby utworzyć i zwrócić iterator, możesz użyć klasy CheckpointClosableIterableImpl.Builder
. Ten fragment kodu pokazuje, jak utworzyć i zwrócić iterator.
Pakiet SDK wykonuje każde wywołanie indeksowania zawarte w iteratorze.
Następne kroki
Oto kilka kolejnych kroków, które możesz wykonać:
- (Opcjonalnie) Jeśli wydajność indeksowania wydaje się niska, zapoznaj się z artykułem Zwiększanie szybkości indeksowania w przypadku
FullTraversalConnector
. - (opcjonalnie) Zaimplementuj metodę
close()
, aby zwolnić wszystkie zasoby przed wyłączeniem. - (opcjonalnie) utwórz łącznik tożsamości za pomocą pakietu SDK Content Connector.
Tworzenie łącznika do przechodzenia po listach za pomocą klasy szablonu
Kolejka indeksowania Cloud Search służy do przechowywania identyfikatorów i opcjonalnych wartości haszowanych dla każdego elementu w repozytorium. Łącznik przeszukiwania list przesyła identyfikatory elementów do kolejki indeksowania Google Cloud Search i pobiera je pojedynczo na potrzeby indeksowania. Google Cloud Search obsługuje kolejki i porównuje ich zawartość, aby określić stan elementów, na przykład czy zostały usunięte z repozytorium. Więcej informacji o kolejce indeksowania Cloud Search znajdziesz w artykule Kolejka indeksowania Cloud Search.
Ta sekcja dokumentów odnosi się do fragmentów kodu z przykładu ListTraversalSample.
Implementacja punktu wejścia oprogramowania sprzęgającego
Punkt wejścia do łącznika to metoda main()
. Głównym zadaniem tej metody jest utworzenie instancji klasy Application
i wywołanie jej metody start()
, aby uruchomić oprogramowanie sprzęgające.
Zanim wywołasz funkcję
application.start()
,
użyj klasy
IndexingApplication.Builder
do utworzenia instancji szablonu
ListingConnector
. Funkcja ListingConnector
przyjmuje obiekt Repository
, którego metody implementujesz. Ten fragment kodu pokazuje, jak utworzyć instancję obiektu ListingConnector
i powiązanego z nim obiektu Repository
:
W tle pakiet SDK wywołuje metodę initConfig()
, gdy metoda main()
w konektorze wywołuje metodę Application.build
.
Metoda initConfig()
:
- Wywołuje metodę
Configuation.isInitialized()
, aby sprawdzić, czy nie została zainicjowana metodaConfiguration
. - Inicjuje obiekt
Configuration
za pomocą par klucz-wartość dostarczonych przez Google. Każda para klucz-wartość jest przechowywana w obiekcieConfigValue
w obiekcieConfiguration
.
Zaimplementuj interfejs Repository
.
Jedynym celem obiektu Repository
jest przeszukiwanie i indeksowanie elementów repozytorium. Aby utworzyć łącznik treści, wystarczy, że podczas korzystania z szablonu zastąpisz niektóre metody w interfejsie Repository
.
Metody, które zastąpisz, zależą od używanego szablonu i strategii przeszukiwania. W przypadku pola ListingConnector
zastąpij te metody:
metoda
init()
. Aby przeprowadzić konfigurację i inicjalizację repozytorium danych, zastąpij metodęinit()
.metoda
getIds()
. Aby pobrać identyfikatory i wartości skrótów wszystkich rekordów w repozytorium, zastąpij metodęgetIds()
.metoda
getDoc()
. Aby dodawać nowe elementy, aktualizować, modyfikować lub usuwać elementy z indeksu, zastąpij metodęgetDoc()
.(Opcjonalnie) metoda
getChanges()
. Jeśli repozytorium obsługuje wykrywanie zmian, zastąpij metodęgetChanges()
. Ta metoda jest wywoływana raz dla każdej zaplanowanej iteracyjnej iteracji (zgodnie z konfiguracją), aby pobrać zmodyfikowane elementy i je zindeksować.(Opcjonalnie) metoda
close()
. Jeśli musisz wyczyścić repozytorium, zastąpij metodęclose()
. Ta metoda jest wywoływana raz podczas zamykania łącznika.
Każda z metod obiektu Repository
zwraca obiekt typu ApiOperation
. Obiekt ApiOperation
wykonuje działanie w postaci pojedynczego lub wielu wywołań IndexingService.indexItem()
, aby przeprowadzić faktyczne indeksowanie repozytorium.
Pobieranie parametrów konfiguracji niestandardowej
W ramach obsługi konfiguracji łącznika musisz pobrać wszystkie parametry niestandardowe z obiektu Configuration
. Zwykle jest to wykonywane w ramach metody Repository
klasy init()
.
Klasa Configuration
udostępnia kilka metod umożliwiających pobieranie różnych typów danych z konfiguracji. Każda metoda zwraca obiekt ConfigValue
. Następnie użyjesz metody get()
obiektu ConfigValue
, aby pobrać rzeczywistą wartość.
Ten fragment kodu z FullTraversalSample
pokazuje, jak pobrać jedną niestandardową wartość całkowitą z obiektu Configuration
:
Aby pobrać i przeanalizować parametr zawierający kilka wartości, użyj jednego z analizatorów typu klasy Configuration
, aby przeanalizować dane na oddzielne fragmenty.
Ten fragment kodu z samouczka używa metody getMultiValue
do uzyskania listy nazw repozytoriów GitHub:
Przechodzenie po liście
Zastąp metodę getIds()
, aby pobrać identyfikatory i wartości skrótów dla wszystkich rekordów w repozytorium.
Metoda getIds()
akceptuje punkt kontrolny. Punkt kontrolny służy do wznowienia indeksowania w przypadku przerwania procesu.
Następnie zastąpij metodę getDoc()
, aby obsłużyć każdy element w kolejce indeksowania Cloud Search.
Przesyłanie identyfikatorów produktów i wartości haszowanych
Zastąp parametrgetIds()
, aby pobrać z repozytorium identyfikatory elementów i powiązane z nimi wartości haszowania treści. Pary identyfikatorów i wartości hasz są następnie pakowane w operację przesyłania do kolejki indeksowania Cloud Search. Najpierw są przesyłane identyfikatory główne lub nadrzędne, a potem identyfikatory podrzędne, aż do momentu, gdy przetworzona zostanie cała hierarchia elementów.
Metoda getIds()
przyjmuje punkt kontrolny reprezentujący ostatni element, który ma zostać zindeksowany. W przypadku przerwania procesu możesz użyć punktu kontrolnego, aby wznowić indeksowanie konkretnego elementu. W przypadku każdego elementu w repozytorium wykonaj te
kroki metody getIds()
:
- Pobierz z repozytorium identyfikator każdego elementu i powiązaną z nim wartość hasz.
- Zawijaj każdą parę identyfikatora i wartości hasha w element
PushItems
. - Połącz każdy element
PushItems
z iteratorem zwracanym przez metodęgetIds()
. Pamiętaj, że funkcjagetIds()
zwraca obiektCheckpointCloseableIterable
, który jest iteracją obiektówApiOperation
. Każdy z nich reprezentuje żądanie interfejsu API wykonane wRepositoryDoc
, np. dodanie elementów do kolejki.
Ten fragment kodu pokazuje, jak pobrać identyfikator każdego elementu i wartość hasha oraz wstawić je do parametru PushItems
.
PushItems
to żądanie ApiOperation
, które przekazuje element do kolejki indeksowania Cloud Search.
Poniższy fragment kodu pokazuje, jak za pomocą klasy PushItems.Builder
zapakować identyfikatory i wartości haszowania do pojedynczego pusha ApiOperation
.
Elementy są przesyłane do kolejki indeksowania Cloud Search w celu dalszego przetwarzania.
Pobieranie i przetwarzanie poszczególnych elementów
ZastąpijgetDoc()
, aby obsłużyć każdy element w kolejce indeksowania Cloud Search.
Element może być nowy, zmodyfikowany, niezmodyfikowany lub może nie istnieć już w repozytorium źródłowym. Pobierać i indeksować każdy nowy lub zmodyfikowany element. Usuń z indeksu elementy, których nie ma już w repozytorium źródłowym.
Metoda getDoc()
przyjmuje element z kolejki indeksowania Google Cloud Search. W przypadku każdego elementu w kole wykonaj te czynności w ramach metody getDoc()
:
Sprawdź, czy identyfikator elementu w kolejce indeksowania Cloud Search istnieje w repozytorium. Jeśli nie, usuń element z indeksu.
Sprawdź indeks pod kątem stanu elementu. Jeśli element nie został zmieniony (
ACCEPTED
), nic nie rób.Zmieniony indeks lub nowe elementy:
- Ustaw uprawnienia.
- Ustaw metadane dla indeksowanego elementu.
- Połącz metadane i element w jeden indeksowalny element.
RepositoryDoc
- Zwrot
RepositoryDoc
.
Uwaga: szablon ListingConnector
nie obsługuje zwracania wartości null
w ramach metody getDoc()
. Zwracanie null
wyników w NullPointerException.
Obsługa usuniętych elementów
Ten fragment kodu pokazuje, jak sprawdzić, czy element istnieje w archiwum, a jeśli nie, usunąć go.
Pamiętaj, że documents
to struktura danych reprezentująca repozytorium. Jeśli documentID
nie zostanie znaleziony w documents
, zwracaj APIOperations.deleteItem(resourceName)
, aby usunąć element z indeksu.
Obsługa niezmienionych elementów
Ten fragment kodu pokazuje, jak sprawdzać stan elementu w kolejce indeksowania Cloud Search i obsługiwać niezmieniony element.
Aby ustalić, czy element nie został zmodyfikowany, sprawdź jego stan oraz inne metadane, które mogą wskazywać na zmianę. W tym przykładzie do określenia, czy element został zmieniony, używany jest skrót metadanych.
Ustawianie uprawnień dotyczących elementu
Repozytorium używa listy kontroli dostępu (ACL) do identyfikowania użytkowników lub grup, które mają dostęp do elementu. Lista ACL to lista identyfikatorów grup lub użytkowników, którzy mają dostęp do elementu.
Musisz powielić reguły ACL używane przez repozytorium, aby mieć pewność, że tylko użytkownicy z dostępem do danego elementu będą mogli go zobaczyć w wynikach wyszukiwania. Podczas indeksowania elementu należy uwzględnić listę ACL elementu, aby Google Cloud Search miał informacje potrzebne do zapewnienia odpowiedniego poziomu dostępu do tego elementu.
Pakiet SDK Content Connector udostępnia bogaty zestaw klas i metod ACL, które umożliwiają modelowanie list ACL większości repozytoriów. Podczas indeksowania elementu musisz przeanalizować listę ACL każdego elementu w repozytorium i utworzyć odpowiednią listę ACL dla Google Cloud Search. Jeśli lista ACL repozytorium korzysta z takich pojęć jak dziedziczenie listy ACL, modelowanie tej listy może być trudne. Więcej informacji o regułach dostępu w Google Cloud Search znajdziesz w artykule Reguły dostępu w Google Cloud Search.
Uwaga: interfejs Cloud Search Indexing API obsługuje uprawnienia ACL dla jednej domeny. Nie obsługuje list ACL między domenami. Użyj klasy Acl.Builder
, aby ustawić dostęp do poszczególnych elementów za pomocą listy kontroli dostępu. Poniższy fragment kodu, pochodzący z pełnego przykładu przeglądania, umożliwia wszystkim użytkownikom lub „podmiotom” (getCustomerPrincipal()
) stać się „czytnikami” wszystkich elementów (.setReaders()
) podczas wyszukiwania.
Aby prawidłowo modelować listy kontroli dostępu w repozytorium, musisz je dobrze rozumieć. Na przykład możesz indeksować pliki w systemie plików, który używa modelu dziedziczenia, w którym foldery podrzędne dziedziczą uprawnienia z folderów nadrzędnych. Modelowanie dziedziczenia uprawnień wymaga dodatkowych informacji opisanych w artykule Uprawnienia dostępu w Google Cloud Search.
Ustawianie metadanych produktu
Metadane są przechowywane w obiekcie Item
. Aby utworzyć element Item
, musisz podać co najmniej unikalny identyfikator ciągu znaków, typ elementu, listę ACL, adres URL i wersję elementu.
Ten fragment kodu pokazuje, jak utworzyć obiekt Item
za pomocą klasy pomocniczej IndexingItemBuilder
.
Tworzenie elementu podlegającego indeksowaniu
Po ustawieniu metadanych elementu możesz utworzyć rzeczywisty indeksowalny element za pomocą RepositoryDoc.Builder
.
W tym przykładzie pokazujemy, jak utworzyć pojedynczy indeksowalny element.
RepositoryDoc
to typ
ApiOperation
, który wykonuje rzeczywiste żądanie
IndexingService.indexItem()
.
Możesz też użyć metody setRequestMode()
klasy RepositoryDoc.Builder
, aby zidentyfikować żądanie indeksowania jako ASYNCHRONOUS
lub SYNCHRONOUS
:
ASYNCHRONOUS
- Tryb asynchroniczny powoduje dłuższy czas od indeksowania do wyświetlania i umożliwia stosowanie dużego limitu przepustowości dla żądań indeksowania. Tryb asynchroniczny jest zalecany do początkowego indeksowania (uzupełniania) całego repozytorium.
SYNCHRONOUS
- Tryb synchroniczny powoduje krótsze opóźnienie między indeksowaniem a wyświetlaniem i umożliwia korzystanie z ograniczonej puli przepustowości. Tryb synchroniczny jest zalecany do indeksowania aktualizacji i zmian w repozytorium. Jeśli nie określisz trybu żądania, zostanie użyte ustawienie domyślne
SYNCHRONOUS
.
Następne kroki
Oto kilka kolejnych kroków, które możesz wykonać:
- (opcjonalnie) Zaimplementuj metodę
close()
, aby zwolnić wszystkie zasoby przed wyłączeniem. - (opcjonalnie) utwórz łącznik tożsamości za pomocą pakietu SDK Content Connector.
Tworzenie złącza do przeszukiwania grafu za pomocą klasy szablonu
Kolejka indeksowania Cloud Search służy do przechowywania identyfikatorów i opcjonalnych wartości haszowanych dla każdego elementu w repozytorium. Połączenie z przeszukiwaniem grafu przesyła identyfikatory elementów do kolejki indeksowania Google Cloud Search i pobiera je pojedynczo na potrzeby indeksowania. Google Cloud Search obsługuje kolejki i porównuje ich zawartość, aby określić stan elementów, np. czy zostały usunięte z repozytorium. Więcej informacji o kole indeksowania Cloud Search znajdziesz w artykule Kole indeksowania Google Cloud Search.
Podczas indeksowania treści produktu są pobierane z repozytorium danych, a identyfikatory wszystkich podrzędnych produktów są dodawane do kolejki. Połączenie działa rekurencyjnie, przetwarzając identyfikatory nadrzędne i podrzędne, dopóki nie zostaną przetworzone wszystkie elementy.
Ta sekcja dokumentów odnosi się do fragmentów kodu z przykładu GraphTraversalSample.
Implementacja punktu wejścia oprogramowania sprzęgającego
Punkt wejścia do łącznika to metoda main()
. Głównym zadaniem tej metody jest utworzenie instancji klasy Application
i wywołanie jej metody start()
, aby uruchomić oprogramowanie sprzęgające.
Zanim wywołasz funkcję application.start()
, użyj klasy IndexingApplication.Builder
, aby utworzyć instancję szablonu ListingConnector
. Funkcja ListingConnector
przyjmuje obiekt Repository
, którego metody implementujesz.
Ten fragment kodu pokazuje, jak utworzyć instancję obiektu ListingConnector
i powiązanego z nim obiektu Repository
:
W tle pakiet SDK wywołuje metodę initConfig()
, gdy metoda main()
w konektorze wywołuje metodę Application.build
.
Metoda initConfig()
:
- Wywołuje metodę
Configuation.isInitialized()
, aby sprawdzić, czy nie została zainicjowana metodaConfiguration
. - Inicjuje obiekt
Configuration
za pomocą par klucz-wartość dostarczonych przez Google. Każda para klucz-wartość jest przechowywana w obiekcieConfigValue
w obiekcieConfiguration
.
Zaimplementuj interfejs Repository
.
Jedynym celem obiektu Repository
jest przeszukiwanie i indeksowanie elementów repozytorium. Aby utworzyć łącznik treści, wystarczy zastąpić określone metody w interfejsie Repository
. Metody, które zastąpisz, zależą od używanego szablonu i strategii przeszukiwania. W przypadku elementu ListingConnector
zastąpisz te metody:
metoda
init()
. Aby przeprowadzić konfigurację i inicjalizację repozytorium danych, zastąpij metodęinit()
.metoda
getIds()
. Aby pobrać identyfikatory i wartości skrótów wszystkich rekordów w repozytorium, zastąpij metodęgetIds()
.metoda
getDoc()
. Aby dodawać nowe elementy, aktualizować, modyfikować lub usuwać elementy z indeksu, zastąpij metodęgetDoc()
.(Opcjonalnie) metoda
getChanges()
. Jeśli repozytorium obsługuje wykrywanie zmian, zastąpij metodęgetChanges()
. Ta metoda jest wywoływana raz dla każdej zaplanowanej iteracyjnej iteracji (zgodnie z konfiguracją), aby pobrać zmodyfikowane elementy i je zindeksować.(Opcjonalnie) metoda
close()
. Jeśli musisz wyczyścić repozytorium, zastąpij metodęclose()
. Ta metoda jest wywoływana raz podczas zamykania łącznika.
Każda z metod obiektu Repository
zwraca obiekt typu ApiOperation
. Obiekt ApiOperation
wykonuje działanie w postaci pojedynczego lub wielu wywołań IndexingService.indexItem()
, aby przeprowadzić indeksowanie repozytorium.
Pobieranie parametrów konfiguracji niestandardowej
W ramach obsługi konfiguracji łącznika musisz pobrać wszystkie parametry niestandardowe z obiektu Configuration
. Zwykle jest to wykonywane w ramach metody Repository
klasy init()
.
Klasa Configuration
udostępnia kilka metod umożliwiających pobieranie różnych typów danych z konfiguracji. Każda metoda zwraca obiekt ConfigValue
. Następnie użyjesz metody get()
obiektu ConfigValue
, aby pobrać rzeczywistą wartość.
Ten fragment kodu z FullTraversalSample
pokazuje, jak pobrać jedną niestandardową wartość całkowitą z obiektu Configuration
:
Aby pobrać i przeanalizować parametr zawierający kilka wartości, użyj jednego z analizatorów typu klasy Configuration
, aby przeanalizować dane na oddzielne fragmenty.
Ten fragment kodu z samouczka używa metody getMultiValue
do uzyskania listy nazw repozytoriów GitHub:
Przechodzenie po grafie
Zastąp metodę getIds()
, aby pobrać identyfikatory i wartości skrótów dla wszystkich rekordów w repozytorium.
Metoda getIds()
akceptuje punkt kontrolny. Punkt kontrolny służy do wznowienia indeksowania w przypadku przerwania procesu.
Następnie zastąpij metodę getDoc()
, aby obsłużyć każdy element w kolejce indeksowania Cloud Search.
Przesyłanie identyfikatorów produktów i wartości haszowanych
Zastąp parametrgetIds()
, aby pobrać z repozytorium identyfikatory elementów i powiązane z nimi wartości haszowania treści. Pary identyfikatorów i wartości hasz są następnie pakowane w operację przesyłania do kolejki indeksowania Cloud Search. Najpierw są przesyłane identyfikatory główne lub nadrzędne, a potem identyfikatory podrzędne, aż do momentu, gdy przetworzona zostanie cała hierarchia elementów.
Metoda getIds()
przyjmuje punkt kontrolny reprezentujący ostatni element, który ma zostać zindeksowany. W przypadku przerwania procesu możesz użyć punktu kontrolnego, aby wznowić indeksowanie konkretnego elementu. W przypadku każdego elementu w repozytorium wykonaj te
kroki metody getIds()
:
- Pobierz z repozytorium identyfikator każdego elementu i powiązaną z nim wartość hasz.
- Zawijaj każdą parę identyfikatora i wartości hasha w element
PushItems
. - Połącz każdy element
PushItems
z iteratorem zwracanym przez metodęgetIds()
. Pamiętaj, że funkcjagetIds()
zwraca obiektCheckpointCloseableIterable
, który jest iteracją obiektówApiOperation
. Każdy z nich reprezentuje żądanie interfejsu API wykonane wRepositoryDoc
, np. dodanie elementów do kolejki.
Ten fragment kodu pokazuje, jak pobrać identyfikator każdego produktu i wartość hasha, a następnie wstawić je do PushItems
. PushItems
to ApiOperation
, czyli żądanie przesłania elementu do kolejki indeksowania Cloud Search.
Ten fragment kodu pokazuje, jak za pomocą klasy PushItems.Builder
zapakować identyfikatory i wartości haszowane w jednym pushu ApiOperation
.
Elementy są przesyłane do kolejki indeksowania Cloud Search w celu dalszego przetwarzania.
Pobieranie i przetwarzanie poszczególnych elementów
ZastąpijgetDoc()
, aby obsłużyć każdy element w kolejce indeksowania Cloud Search.
Element może być nowy, zmodyfikowany, niezmodyfikowany lub może nie istnieć już w repozytorium źródłowym. Pobierać i indeksować każdy nowy lub zmodyfikowany element. Usuń z indeksu elementy, których nie ma już w repozytorium źródłowym.
Metoda getDoc()
przyjmuje element z kolejki indeksowania Cloud Search. W przypadku każdego elementu w kole wykonaj te czynności w ramach metody getDoc()
:
Sprawdź, czy identyfikator elementu w kolejce indeksowania Cloud Search istnieje w repozytorium. Jeśli nie, usuń element z indeksu. Jeśli element istnieje, przejdź do następnego kroku.
Zmieniony indeks lub nowe elementy:
- Ustaw uprawnienia.
- Ustaw metadane dla indeksowanego elementu.
- Połącz metadane i element w jeden indeksowalny element.
RepositoryDoc
- Umieść identyfikatory podrzędne w kolejce indeksowania Cloud Search, aby przetworzyć je dalej.
- Zwrot
RepositoryDoc
.
Obsługa usuniętych elementów
Ten fragment kodu pokazuje, jak sprawdzić, czy element istnieje w indeksie, a jeśli nie, usunąć go.
Ustawianie uprawnień dotyczących elementu
Repozytorium używa listy kontroli dostępu (ACL) do identyfikowania użytkowników lub grup, które mają dostęp do elementu. Lista ACL to lista identyfikatorów grup lub użytkowników, którzy mają dostęp do elementu.
Musisz powielić reguły ACL używane przez repozytorium, aby mieć pewność, że tylko użytkownicy z dostępem do danego elementu będą mogli go zobaczyć w wynikach wyszukiwania. Podczas indeksowania elementu należy uwzględnić listę ACL elementu, aby Google Cloud Search miał informacje potrzebne do zapewnienia odpowiedniego poziomu dostępu do tego elementu.
Pakiet SDK Content Connector udostępnia bogaty zestaw klas i metod ACL, które umożliwiają modelowanie list ACL większości repozytoriów. Podczas indeksowania elementu musisz przeanalizować listę ACL każdego elementu w repozytorium i utworzyć odpowiednią listę ACL dla Google Cloud Search. Jeśli lista ACL repozytorium korzysta z takich pojęć jak dziedziczenie listy ACL, modelowanie tej listy może być trudne. Więcej informacji o regułach dostępu w Google Cloud Search znajdziesz w artykule Reguły dostępu w Google Cloud Search.
Uwaga: interfejs Cloud Search Indexing API obsługuje uprawnienia ACL dla jednej domeny. Nie obsługuje list ACL między domenami. Użyj klasy Acl.Builder
, aby ustawić dostęp do poszczególnych elementów za pomocą listy kontroli dostępu. Poniższy fragment kodu, pochodzący z pełnego przykładu przeglądania, umożliwia wszystkim użytkownikom lub „podmiotom” (getCustomerPrincipal()
) stać się „czytnikami” wszystkich elementów (.setReaders()
) podczas wyszukiwania.
Aby prawidłowo modelować listy kontroli dostępu w repozytorium, musisz je dobrze rozumieć. Na przykład możesz indeksować pliki w systemie plików, który używa modelu dziedziczenia, w którym foldery podrzędne dziedziczą uprawnienia z folderów nadrzędnych. Modelowanie dziedziczenia uprawnień wymaga dodatkowych informacji opisanych w artykule Uprawnienia dostępu w Google Cloud Search.
Ustawianie metadanych produktu
Metadane są przechowywane w obiekcie Item
. Aby utworzyć element Item
, musisz podać co najmniej unikalny identyfikator ciągu znaków, typ elementu, listę ACL, adres URL i wersję elementu.
Ten fragment kodu pokazuje, jak utworzyć obiekt Item
za pomocą klasy pomocniczej IndexingItemBuilder
.
Tworzenie elementu podlegającego indeksowaniu
Po ustawieniu metadanych elementu możesz utworzyć rzeczywisty indeksowalny element za pomocą RepositoryDoc.Builder
.
W tym przykładzie pokazujemy, jak utworzyć pojedynczy indeksowalny element.
RepositoryDoc
to typ ApiOperation
, który wykonuje rzeczywiste żądanie IndexingService.indexItem()
.
Możesz też użyć metody setRequestMode()
klasy RepositoryDoc.Builder
, aby zidentyfikować żądanie indeksowania jako ASYNCHRONOUS
lub SYNCHRONOUS
:
ASYNCHRONOUS
- Tryb asynchroniczny powoduje dłuższy czas od indeksowania do wyświetlania i umożliwia stosowanie dużego limitu przepustowości dla żądań indeksowania. Tryb asynchroniczny jest zalecany do początkowego indeksowania (uzupełniania) całego repozytorium.
SYNCHRONOUS
- Tryb synchroniczny powoduje krótsze opóźnienie między indeksowaniem a wyświetlaniem i umożliwia korzystanie z ograniczonej puli przepustowości. Tryb synchroniczny jest zalecany do indeksowania aktualizacji i zmian w repozytorium. Jeśli nie określisz trybu żądania, zostanie użyte ustawienie domyślne
SYNCHRONOUS
.
Umieść identyfikatory podrzędne w kolejce indeksowania Cloud Search
Ten fragment kodu pokazuje, jak uwzględnić identyfikatory podrzędnych elementów w kole do przetwarzania dla obecnie przetwarzanego elementu nadrzędnego. Te identyfikatory są przetwarzane po zindeksowaniu elementu nadrzędnego.
Następne kroki
Oto kilka kolejnych kroków, które możesz wykonać:
- (opcjonalnie) Zaimplementuj metodę
close()
, aby zwolnić wszystkie zasoby przed wyłączeniem. - (opcjonalnie) utwórz łącznik tożsamości za pomocą pakietu SDK łącznika tożsamości.
Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST
W kolejnych sekcjach opisujemy, jak utworzyć oprogramowanie sprzęgające treści za pomocą interfejsu API REST.
Określanie strategii przeszukiwania
Podstawową funkcją łącznika treści jest przeszukiwanie repozytorium i indeksowanie jego danych. Musisz zastosować strategię przeszukiwania na podstawie rozmiaru i układu danych w repozytorium. Oto 3 popularne strategie przeszukiwania:
- Strategia pełnego przeszukiwania
Strategia pełnego przeszukiwania skanuje całe repozytorium i indeksuje wszystkie elementy. Ta strategia jest często stosowana, gdy masz małą repozytorię i możesz sobie pozwolić na obciążenie związane z pełnym przeszukiwaniem za każdym razem, gdy indeksujesz.
Ta strategia przeszukiwania jest odpowiednia w przypadku małych repozytoriów z głównie statycznymi, niehierarchicznymi danymi. Możesz też użyć tej strategii przeszukiwania, gdy wykrywanie zmian jest trudne lub nieobsługiwane przez repozytorium.
- List traversal strategy
Strategia przeszukiwania listy skanuje całe repozytorium, w tym wszystkie węzły podrzędne, określając stan każdego elementu. Następnie oprogramowanie sprzęgające wykonuje drugi pass i indeksuje tylko elementy, które są nowe lub zostały zaktualizowane od czasu ostatniego indeksowania. Ta strategia jest często stosowana do wykonywania przyrostowych aktualizacji istniejącego indeksu (zamiast pełnego przeszukiwania za każdym razem, gdy indeks jest aktualizowany).
Ta strategia przeszukiwania jest odpowiednia, gdy wykrywanie zmian jest trudne lub nieobsługiwane przez repozytorium, gdy masz dane niehierarchiczne i pracujesz z bardzo dużymi zbiorami danych.
- Przeglądanie grafu
Strategia przeszukiwania grafu skanuje cały węzeł nadrzędny, aby określić stan każdego elementu. Następnie oprogramowanie sprzęgające wykonuje drugi przejazd i indeksuje tylko te elementy w węźle głównym, które są nowe lub zostały zaktualizowane od czasu ostatniego indeksowania. Na koniec usługa przekazuje wszystkie identyfikatory elementów podrzędnych, a następnie indeksuje elementy w węzłach podrzędnych, które są nowe lub zostały zaktualizowane. Połączenie przechodzi rekurencyjnie przez wszystkie węzły podrzędne, dopóki nie zostaną przetworzone wszystkie elementy. Takie przeszukiwanie jest zwykle używane w przypadku repozytoriów hierarchicznych, w których wyświetlanie wszystkich identyfikatorów nie jest praktyczne.
Ta strategia jest odpowiednia, jeśli masz dane hierarchiczne, które wymagają zindeksowania, np. katalogi serii lub strony internetowe.
Wdrażanie strategii przeszukiwania i indeksowania elementów
Każdy indeksowany element w Cloud Search jest w Cloud Search API nazywany elementem. Element może być plikiem, folderem, wierszem w pliku CSV lub rekordem w bazie danych.
Po zarejestrowaniu schematu możesz wypełnić indeks, wykonując te czynności:
(opcjonalnie) Użyj polecenia
items.upload
, aby przesłać pliki większe niż 100 KiB na potrzeby indeksowania. W przypadku mniejszych plików osadzaj je za pomocą atrybutu inlineContent (treści wstawione w tekście) za pomocą atrybutuitems.index
.(Opcjonalnie) Użyj
media.upload
, aby przesłać pliki multimedialne do indeksowania.Użyj elementu
items.index
, aby zindeksować element. Jeśli na przykład Twój schemat używa definicji obiektu w schemacie filmu, żądanie indeksowania pojedynczego elementu będzie wyglądać tak:{ "name": "datasource/<data_source_id>/items/titanic", "acl": { "readers": [ { "gsuitePrincipal": { "gsuiteDomain": true } } ] }, "metadata": { "title": "Titanic", "viewUrl": "http://www.imdb.com/title/tt2234155/?ref_=nv_sr_1", "objectType": "movie" }, "structuredData": { "object": { "properties": [ { "name": "movieTitle", "textValues": { "values": [ "Titanic" ] } }, { "name": "releaseDate", "dateValues": { "values": [ { "year": 1997, "month": 12, "day": 19 } ] } }, { "name": "actorName", "textValues": { "values": [ "Leonardo DiCaprio", "Kate Winslet", "Billy Zane" ] } }, { "name": "genre", "enumValues": { "values": [ "Drama", "Action" ] } }, { "name": "userRating", "integerValues": { "values": [ 8 ] } }, { "name": "mpaaRating", "textValues": { "values": [ "PG-13" ] } }, { "name": "duration", "textValues": { "values": [ "3 h 14 min" ] } } ] } }, "content": { "inlineContent": "A seventeen-year-old aristocrat falls in love with a kind but poor artist aboard the luxurious, ill-fated R.M.S. Titanic.", "contentFormat": "TEXT" }, "version": "01", "itemType": "CONTENT_ITEM" }
(Opcjonalnie) Użycie wywołań items.get, aby sprawdzić, czy element został zindeksowany.
Aby przeprowadzić pełne przeszukiwanie, musisz okresowo ponownie zindeksować całe repozytorium. Aby przeprowadzić skanowanie listy lub grafu, musisz zaimplementować kod, który obsługuje zmiany w repozytorium.
Obsługa zmian w repozytorium
Możesz okresowo zbierać i indeksować każdy element z repozytorium, aby przeprowadzić pełne indeksowanie. Chociaż pełne indeksowanie zapewnia aktualność indeksu, może być kosztowne w przypadku większych lub hierarchicznych repozytoriów.
Zamiast używać wywołań indeksu do indeksowania całej repozytorium co jakiś czas możesz też użyć kolejki indeksowania Google Cloud jako mechanizmu śledzenia zmian i indeksowania tylko tych elementów, które się zmieniły. Za pomocą żądań items.push możesz przesyłać elementy do kolejki w celu późniejszego pobierania i aktualizowania. Więcej informacji o kolejce indeksowania Google Cloud znajdziesz w artykule Kolejka indeksowania Google Cloud.
Więcej informacji o interfejsie Cloud Search API znajdziesz w dokumentacji Cloud Search API.