Akcje dotyczące rozmów

Czynności konwersacyjne rozszerzają możliwości Asystenta Google, umożliwiając tworzenie dla użytkowników Asystenta Google niestandardowych doświadczeń i rozmów. Akcja konwersacyjna obsługuje prośby Asystenta i zwraca odpowiedzi z komponentami audio i wideo. Działania konwersacyjne mogą przed wysłaniem odpowiedzi komunikować się z zewnętrznymi usługami internetowymi za pomocą webhooków, aby dodawać logikę rozmowy lub zadania biznesowe.

Podczas rozmowy z Asystentem Google użytkownik otrzymuje pytanie o sesję konferencji i otrzymuje odpowiedź.
Ilustracja 1. Przykład działania konwersacyjnego

Po co tworzyć

Typowe interfejsy komputerowe do prawidłowego działania wymagają uporządkowanych i przewidywalnych danych wejściowych, co sprawia, że korzystanie z nich jest naturalne i niekiedy trudne. Jeśli użytkownicy nie będą w stanie z łatwością zrozumieć, jak działają te uporządkowane dane, nie będą mogli znaleźć rozwiązania.

Weźmy na przykład proste zapytanie – na przykład „Jaka jest dzisiaj prognoza?”. Inni użytkownicy mogą też zadawać pytania typu „Jaka jest dziś pogoda?”" lub „Jaka będzie jutro temperatura w Poznaniu?”" Nawet po prostym pytaniu widać, że doświadczenia konwersacyjne są trudne do wdrożenia, ponieważ interpretacja i przetwarzanie języka naturalnego wymaga bardzo solidnego parsera językowego, który jest w stanie zrozumieć niuanse języka. Twój kod musiałby obsługiwać wszystkie te typy żądań (i nawet wiele innych), aby realizować te same zasady: wyszukując informacje do prognozowania dotyczące czasu i lokalizacji. Dlatego tradycyjny interfejs komputerowy wymaga dobrze znanych, standardowych żądań wejściowych negatywnie wpływających na wrażenia użytkowników, ponieważ ułatwia obsługę bardzo uporządkowanych danych.

Kiedy jednak tworzysz akcje konwersacyjne, Asystent radzi sobie z rozumieniem języka naturalnego, dzięki czemu możesz łatwo tworzyć otwarte interfejsy rozmów. Te narzędzia pozwalają zrozumieć szeroki wachlarz i różnorodność ludzkich niuansów, a potem przetłumaczyć je na standardowe i uporządkowane informacje, które będą zrozumiałe dla aplikacji i usług. Przyjrzyjmy się, jak działanie może obsłużyć poprzednie przykłady żądań prognozy pogody.

Ilustracja 1. Dopasowanie intencji NLU

Aby sprawdzić prognozę pogody, możesz potrzebować kilku informacji, takich jak czas, kiedy użytkownicy chcą poznać prognozę, i ich lokalizację. Jak już wspomnieliśmy, różni użytkownicy mogą poprosić o prognozę w inny sposób. Asystent może zrozumieć te różnice i przekazać je do standardowego zamiaru użytkownika, aby otrzymać prognozę. Może on przeanalizować żądanie użytkownika dotyczące danych związanych z żądaniem. W takim przypadku do określenia pogody dla danej lokalizacji należy użyć jej czasu i lokalizacji. Możesz też użyć tych danych do wyszukiwania pogody za pomocą publicznego interfejsu API REST i zwrócić użytkownikowi pogodę w formie komunikatu.

Kiedy tworzyć

Akcje konwersacyjne sprawdzają się najlepiej w przypadku prostych przypadków użycia, które pozwalają użytkownikom szybko wykonywać zadania, oraz w przypadku atrakcyjnych rozwiązań głosowych. Dobre działania konwersacyjne często należą do następujących kategorii ogólnych:

  • Na co użytkownicy mogą łatwo odpowiedzieć. Działania, które można wykonać przy użyciu nieznanych danych, takich jak data lub godzina, np. rezerwacja lotu.
  • Szybkie, ale przydatne akcje. Takie rozwiązanie daje użytkownikom zwykle błyskawiczną korzyść, taką jak czas mecze ulubionej drużyny sportowej.
  • Działania, które z natury są lepiej dostosowane do głosu. Zwykle są to czynności, które wykonujesz bez użycia rąk, np. sesja z trenerem podczas jogi lub ćwiczeń fizycznych albo gra stworzona na potrzeby komunikacji głosowej.

Jak budować

Actions on Google umożliwia tworzenie działań konwersacyjnych za pomocą pakietów Actions SDK i Kreatora działań. Ta funkcja umożliwia wybór najlepszego procesu programowania stosownie do potrzeb przy jednoczesnym zachowaniu elastyczności przełączania się między nimi.

Ten pakiet SDK zawiera standardowy schemat oparty na plikach do tworzenia działań, biblioteki umożliwiające interakcję z Asystentem oraz interfejs wiersza poleceń do wdrażania projektu i zarządzania nim. Actions Builder jest oparty na tej samej technologii co Actions SDK i umożliwia tworzenie aplikacji za pomocą łatwego w użyciu i zaawansowanego środowiska IDE.

Więcej informacji znajdziesz w artykule Omówienie kompilacji.

Dalsze kroki

Aby rozpocząć tworzenie, już teraz zapoznaj się z tymi materiałami:

  • Krótki przewodnik dla początkujących – krótkie wprowadzenie do konfigurowania środowiska i rozpoczęcia korzystania z pakietu SDK Actions i Kreatora.
  • Ćwiczenia z programowania – zawierają szczegółowe i szczegółowe instrukcje tworzenia działań dla Asystenta Google.
  • Przykłady – pobierz wszystkie nasze próbki na GitHubie, aby zacząć eksperymentować już teraz.