Działania konwersacyjne zostaną wycofane 13 czerwca 2023 r. Więcej informacji znajdziesz w artykule o zachodzie słońca między rozmowami.

Akcje dotyczące rozmów

Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Działania w ramach rozmów umożliwiają poszerzenie funkcjonalności Asystenta Google. Umożliwiają one tworzenie niestandardowych rozmów lub interakcji dla użytkowników z Asystentem Google. Akcja konwersacyjna obsługuje żądania Asystenta i zwraca odpowiedzi z komponentami audio i wizualnymi. Działania w ramach rozmowy mogą również przed nawiązaniem odpowiedzi komunikować się z zewnętrznymi usługami internetowymi za pomocą webhooków, dodając logikę rozmowy lub firmę.

Podczas szczegółowej rozmowy z Asystentem Google użytkownik pyta o sesję konferencyjną i otrzymuje odpowiedź.
Ilustracja 1. Przykład działania konwersacyjnego

Po co tworzyć

Typowe interfejsy komputerowe do prawidłowego funkcjonowania wymagają uporządkowanych i przewidywalnych danych wejściowych, co sprawia, że korzystanie z nich jest nienaturalne i czasem trudne. Jeśli użytkownicy nie są w stanie odgadnąć uporządkowanych danych, mogą mieć problem z określeniem, co zrobić.

Weźmy na przykład proste żądanie użytkownika, np. „Jaka jest dzisiaj prognoza?”. Inni użytkownicy mogą też zapytać „Jaka jest teraz pogoda?” lub „Jaka będzie jutro temperatura w Krakowie?” Nawet przy tym prostym pytaniu widać, że doświadczenia konwersacyjne są trudne do wdrożenia, ponieważ interpretacja i przetwarzanie języka naturalnego wymaga bardzo solidnego parsera języka, który jest w stanie zrozumieć niuanse języka. Twój kod musiałby obsługiwać wszystkie tego typu żądania (i potencjalnie wiele innych), aby realizować tę samą logikę: sprawdzać informacje dotyczące prognozy dotyczącej czasu i lokalizacji. Dlatego tradycyjny interfejs komputera wymaga dobrze znanych, standardowych żądań wejściowych, które negatywnie wpływają na wrażenia użytkowników, ponieważ łatwiej jest obsługiwać bardzo uporządkowane dane wejściowe.

Gdy jednak tworzysz akcje konwersacyjne, Asystent obsługuje język naturalny (NLU), dzięki czemu możesz łatwo tworzyć otwarte interfejsy rozmowy. Narzędzia interfejsu umożliwiają zrozumienie różnorodnych, niuansów ludzkich języków, a następnie pozwalają je zrozumieć w sposób standardowy i uporządkowany, zrozumiały dla aplikacji i usług. Przyjrzyjmy się, jak działanie może obsłużyć poprzednie przykłady żądań prognozy pogody.

Rysunek 1. Dopasowanie intencji NLU

Aby sprawdzić prognozę pogody, możesz potrzebować kilku informacji, np. godziny, w jakiej użytkownicy chcą uzyskać prognozę, i ich lokalizacji. Jak już wspomnieliśmy, inni użytkownicy mogą prosić o prognozę w inny sposób. Asystent może zrozumieć te różnice i przekazać je do standardowego zamiaru użytkownika, aby uzyskać prognozę. Może on przeanalizować żądanie użytkownika dla istotnych danych potrzebnych do zrealizowania żądania. To czas, w jakim użytkownik chce sprawdzić pogodę. Na koniec możesz wykorzystać te dane, aby sprawdzić pogodę za pomocą publicznego interfejsu API REST i wyświetlić użytkownikowi pogodę w formie komunikatu.

Kiedy tworzyć

Akcje konwersacyjne sprawdzają się najlepiej w przypadku prostych przypadków użycia, które pozwalają użytkownikom szybko wykonywać zadania, oraz przypadków wciągających, zachęcających do działania. Dobre rozmowy konwersacyjne często dzielą się na te kategorie ogólne:

  • Rzeczy, na które ludzie mogą łatwo odpowiadać. Działania, które można wykonać, używając znanych danych wejściowych, np. godzin lub dat, np. rezerwowania lotu.
  • Szybkie, ale przydatne działania. Zwykle zapewniają one użytkownikom natychmiastową korzyść przez bardzo krótki czas, na przykład informację o tym, kiedy gra ich ulubiona drużyna sportowa.
  • Działania, które z natury są lepiej dopasowane do głosu. Zazwyczaj są to czynności, które możesz wykonać bez użycia rąk, np. korzystanie z porad w trakcie jogi albo ćwiczeń fizycznych lub gier stworzonych z myślą o głosach.

Jak budować

Actions on Google umożliwia swobodne tworzenie działań konwersacyjnych za pomocą pakietu SDK Actions, kreatora działań lub obu tych opcji. Ta funkcja umożliwia wybór najlepszego procesu programowania stosownie do potrzeb oraz daje możliwość swobodnego przełączania się tam i z powrotem.

SDK Actions to standardowy, oparty na plikach schemat do tworzenia działań, biblioteki do interakcji z Asystentem oraz interfejs wiersza poleceń, który pozwala wdrażać projekt Actions i nim zarządzać. Narzędzie Actions Builder działa w oparciu o tę samą technologię co pakiet SDK Actions, a jego zaletą jest łatwy w użyciu i wszechstronny IDE.

Więcej informacji znajdziesz w artykule Omówienie kompilacji.

Dalsze kroki

Zapoznaj się z tymi materiałami, aby zacząć budować już teraz:

  • Szybki przewodnik – krótkie wprowadzenie do konfigurowania środowiska i rozpoczęcia programowania za pomocą pakietu SDK Actions i Kreatora.
  • Ćwiczenia z programowania – zawierają szczegółowe instrukcje tworzenia działań za pomocą Asystenta Google.
  • Przykłady – aby rozpocząć eksperyment, pobierz wszystkie nasze próbki na GitHubie.