Hành động trò chuyện mở rộng chức năng của Trợ lý Google bằng cách cho phép nhà phát triển tạo trải nghiệm hoặc cuộc trò chuyện tuỳ chỉnh cho người dùng trên Trợ lý. Trong một cuộc trò chuyện, Hành động trò chuyện của bạn sẽ xử lý các yêu cầu từ Trợ lý và trả về phản hồi bằng các thành phần âm thanh và hình ảnh. Hành động trò chuyện cũng có thể kết nối với các dịch vụ bên ngoài để bổ sung thêm logic trò chuyện hoặc kinh doanh trước khi trả về câu trả lời.
Ví dụ: người dùng có thể gọi Hành động trò chuyện để nhận phản hồi từ dịch vụ thực hiện đơn hàng bên ngoài khi muốn tra cứu thông tin, nhận nội dung đề xuất dành riêng cho bạn hoặc thực hiện giao dịch liên quan đến việc thanh toán bằng hình thức kỹ thuật số.
Trường hợp sử dụng
Tính năng Hành động trò chuyện hoạt động hiệu quả nhất trong các trường hợp sử dụng đơn giản mà giúp bổ sung cho một trải nghiệm khác. Hành động trò chuyện hiệu quả thường thuộc các loại sau:
- Những thông tin mà mọi người có thể dễ dàng trả lời. Những hành động có thể thực hiện được bằng những dữ liệu nhập quen thuộc như thời gian hoặc ngày tháng, chẳng hạn như đặt vé máy bay.
- Hành động nhanh chóng nhưng hấp dẫn và hữu ích. Những tính năng này thường mang lại cho người dùng lợi ích ngay lập tức mà chỉ mất rất ít thời gian, chẳng hạn như biết được thời điểm đội thể thao họ yêu thích sẽ thi đấu tiếp theo.
- Hành động vốn phù hợp hơn với giọng nói. Đây thường là những việc bạn muốn làm mà không cần dùng tay, chẳng hạn như nhận huấn luyện trong khi yoga hoặc tập thể dục nhẹ.
Cách hoạt động của tính năng Hành động trò chuyện
Khác với các ứng dụng truyền thống dành cho máy tính và thiết bị di động (sử dụng mô hình tập trung vào máy tính), người dùng tương tác với Actions cho Trợ lý thông qua cuộc trò chuyện qua lại giống như âm thanh tự nhiên. Hành động trò chuyện bắt đầu khi được người dùng gọi và tiếp tục cho đến khi người dùng chọn thoát (sử dụng cụm từ được xác định trước) hoặc Hành động trò chuyện biểu thị kết thúc cuộc trò chuyện.
Trong một cuộc trò chuyện, dữ liệu đầu vào của người dùng sẽ được Trợ lý chuyển đổi từ lời nói sang văn bản và được tạo thành các yêu cầu JSON để xử lý ngôn ngữ tự nhiên. Những yêu cầu này sẽ được gửi đến phương thức thực hiện cuộc trò chuyện.
Phương thức thực hiện cuộc trò chuyện của bạn sẽ phân tích cú pháp truy vấn của người dùng thành dữ liệu có cấu trúc, xử lý dữ liệu đó và trả về phản hồi JSON webhook cho Trợ lý. Sau đó, Trợ lý sẽ xử lý và hiển thị phản hồi của bạn cho người dùng.
Việc xây dựng dịch vụ xử lý ngôn ngữ tự nhiên của riêng bạn có thể là một thách thức. Vì vậy, chúng tôi cung cấp Dialogflow như một cách để xử lý dịch vụ này cho bạn. Đối với các nhà phát triển không thể sử dụng Dialogflow, chúng tôi cũng cung cấp Actions SDK làm tuỳ chọn dự phòng với một đường dẫn phát triển riêng biệt nhưng có liên quan.
Sau khi bạn thiết lập một nhân viên hỗ trợ trong Dialogflow, phương thức thực hiện cuộc trò chuyện của bạn sẽ được tăng cường bằng các tính năng của Dialogflow, bao gồm cả khả năng sử dụng phương thức thực hiện bằng Dialogflow. Phương pháp này cho phép bạn tách riêng phương thức thực hiện cuộc trò chuyện khỏi các dịch vụ khác mà bạn có thể cần cung cấp cho người dùng kết quả mong muốn.
Xây dựng hành động trò chuyện
Hầu hết việc tạo Hành động trò chuyện là thiết kế cuộc trò chuyện và xây dựng phương thức thực hiện cuộc trò chuyện. Hãy coi cuộc trò chuyện là giao diện người dùng của Hành động trò chuyện. Bạn cần suy nghĩ về cách người dùng gọi dự án Hành động, những điều hợp lệ họ có thể nói trong một cuộc trò chuyện và cách dự án Hành động phản hồi các dự án đó.
Trong dự án Actions, bạn cung cấp siêu dữ liệu để phát hành dự án và chỉ định một phương thức thực hiện cuộc trò chuyện. Các nhà phát triển sử dụng Dialogflow liên kết nhân viên hỗ trợ Dialogflow của họ với dự án, sau đó tạo phương thức thực hiện thông qua Dialogflow. Đối với các nhà phát triển sử dụng SDK Hành động, việc xây dựng phương thức thực hiện cuộc trò chuyện bao gồm việc lập trình và triển khai ở định dạng webhook của cuộc trò chuyện.
Khi thiết kế cuộc trò chuyện, bạn nên sử dụng các quy trình và nguyên tắc thiết kế của chúng tôi. Giao diện trò chuyện vẫn là một công nghệ tương đối mới và việc tìm hiểu về các phương pháp hay nhất có thể giúp bạn tiết kiệm thời gian trong tương lai.
Thực hiện đơn hàng bằng Dialogflow
Khi tích hợp với nhân viên hỗ trợ Dialogflow, nhân viên hỗ trợ này sẽ xử lý NLU cho các truy vấn của người dùng trong Hành động trò chuyện của bạn. Nhân viên hỗ trợ dự án Dialogflow của bạn sẽ thực hiện những việc sau cho bạn trong bước này:
- Phân tích cú pháp từng yêu cầu đến từ Trợ lý dựa trên các cụm từ huấn luyện mà bạn cung cấp và ngữ cảnh trò chuyện.
- So khớp từng yêu cầu với một ý định trong Dialogflow (còn gọi là sự kiện).
- Trích xuất thông số vào các thực thể Dialogflow.
Sau đó, nhân viên hỗ trợ Dialogflow của bạn có thể gọi phương thức thực hiện của riêng mình (được triển khai dưới dạng webhook) để thực hiện một số logic như gọi API REST hoặc dịch vụ phụ trợ khác tạo ra phản hồi để quay lại Trợ lý. Webhook này còn được gọi là phương thức thực hiện dự án Dialogflow của bạn và sử dụng định dạng webhook củaDialogflow.
Khi sử dụng Dialogflow, bạn chủ yếu cần tạo phương thức thực hiện cuộc trò chuyện bằng cách phát triển webhook thực hiện cuộc trò chuyện bằng Dialogflow. Trong tài liệu về Actions on Google, bạn sẽ thấy các tài nguyên giúp bạn thiết kế, xây dựng và kiểm thử webhook của phương thức thực hiệnDialogflow. Đáng chú ý nhất là các tài nguyên đó bao gồm thư viện ứng dụng Node.js và thư viện ứng dụng Java.
Khi tạo bằng Dialogflow, bạn sẽ sử dụng Bảng điều khiển Dialogflow để tạo ý định, thực thể và cụm từ đào tạo trongDialogflow.
Để biết thêm thông tin chung về Dialogflow, bạn có thể đọc về tích hợp Actions on Google trong tài liệu về Dialogflow.
Phương thức thực hiện bằng cách sử dụng SDK Hành động
Việc xây dựng phương thức thực hiện cuộc trò chuyện bằng SDK Hành động chủ yếu bao gồm việc tạo và triển khai Gói Hành động. Gói hành động được tạo ở định dạng ActionPackage
và sử dụng định dạng webhook cuộc trò chuyện.
Gói Hành động chứa tất cả Hành động cho một dự án Actions cụ thể.
Trợ lý cung cấp truy vấn của người dùng để thực hiện cuộc trò chuyện bằng cách sử dụng ý định Actions on Google. Đối với mỗi ý định, webhook thực hiện của bạn phải phân tích cú pháp ý định, xử lý ý định và trả về phản hồi JSON cho Trợ lý cho người dùng.
Phản hồi
Khi tạo một Hành động cho Trợ lý, bạn sẽ thiết kế cuộc trò chuyện cho nhiều nền tảng, chẳng hạn như cuộc trò chuyện tập trung vào giọng nói cho loa kích hoạt bằng giọng nói hoặc cuộc trò chuyện bằng hình ảnh trên nền tảng mà Trợ lý hỗ trợ. Phương pháp này cho phép người dùng hoàn tất công việc nhanh chóng thông qua khả năng thoại hoặc hình ảnh.
Khi tạo phương thức thực hiện, bạn có thể chọn trong số nhiều loại phản hồi hấp dẫn để Trợ lý hiển thị với người dùng. Các kiểu kết hợp này đa dạng từ bong bóng trò chuyện chứa văn bản đơn giản đến phản hồi nội dung đa phương tiện, băng chuyền và thậm chí là HTML sử dụng Canvas tương tác.
Các bước tiếp theo
Tham gia lớp học lập trình Tạo hành động cho Trợ lý Google (Cấp 1) để được hướng dẫn chi tiết từng bước về cách bắt đầu tạo Hành động trò chuyện đầu tiên.
Sau đó, bạn có thể tiếp tục làm theo hướng dẫn của chúng tôi để tạo phương thức thực hiện cuộc trò chuyện của riêng bạn bằng Dialogflow hoặc bằng SDK Hành động. Bạn cũng có thể khám phá các tài nguyên bổ sung sau đây để xây dựng tính năng Hành động trò chuyện:
- Kho lưu trữ Actions on Google GitHub: Mã mẫu và thư viện.
- r/GoogleAssistantDev: Cộng đồng Reddit chính thức dành cho các nhà phát triển chuyên phụ trách về Trợ lý Google.