Hành động giao tiếp

Hành động trò chuyện giúp mở rộng chức năng của Trợ lý Google bằng cách cho phép bạn tạo trải nghiệm hoặc cuộc trò chuyện tuỳ chỉnh cho người dùng Trợ lý Google. Trong một cuộc trò chuyện, Hành động trò chuyện của bạn xử lý yêu cầu từ Trợ lý và trả về câu trả lời có các thành phần âm thanh và hình ảnh. Hành động trò chuyện cũng có thể giao tiếp với các dịch vụ web bên ngoài bằng webhook để bổ sung logic trò chuyện hoặc kinh doanh trước khi trả lời phản hồi.

Trong
    cuộc trò chuyện qua lại với Trợ lý Google, người dùng hỏi về
    và nhận được câu trả lời khi phiên hội nghị đang diễn ra.
Hình 1. Ví dụ về một Hành động trò chuyện

Lý do tạo

Các giao diện máy tính thông thường đòi hỏi dữ liệu đầu vào có cấu trúc và dễ dự đoán để hoạt động bình thường. Điều này khiến việc sử dụng các giao diện này không tự nhiên và đôi khi khó khăn. Nếu người dùng không thể dễ dàng tìm ra dữ liệu đầu vào có cấu trúc này, thì họ sẽ gặp khó khăn trong việc tìm ra việc cần làm.

Ví dụ: hãy xem xét một yêu cầu đơn giản của người dùng như "Dự báo thời tiết hôm nay như thế nào?" Những người dùng khác cũng có thể hỏi "Thời tiết hiện giờ thế nào?" hoặc "Nhiệt độ ở San Francisco ngày mai thế nào?" Ngay cả với câu hỏi đơn giản này, bạn có thể thấy rằng trải nghiệm trò chuyện rất khó triển khai, vì việc diễn giải và xử lý ngôn ngữ tự nhiên đòi hỏi một trình phân tích cú pháp ngôn ngữ rất mạnh mẽ có khả năng hiểu được các sắc thái của ngôn ngữ. Mã của bạn sẽ phải xử lý tất cả các loại yêu cầu này (và có thể nhiều loại yêu cầu khác) để thực hiện cùng một logic: tra cứu một số thông tin dự báo cho một thời điểm và vị trí. Vì lý do này, giao diện máy tính truyền thống đòi hỏi các yêu cầu đầu vào tiêu chuẩn, nổi tiếng để xử lý trải nghiệm người dùng dễ dàng hơn, vì giao diện này sẽ dễ dàng xử lý dữ liệu đầu vào có cấu trúc cao.

Tuy nhiên, khi bạn tạo Hành động trò chuyện, Trợ lý sẽ xử lý khả năng hiểu ngôn ngữ tự nhiên (NLU) cho bạn, nhờ đó bạn có thể dễ dàng xây dựng giao diện trò chuyện có kết thúc mở. Các công cụ giao diện này giúp bạn hiểu được những sắc thái đa dạng của ngôn ngữ của con người và dịch sang ngôn ngữ chuẩn và có cấu trúc mà các ứng dụng và dịch vụ của bạn có thể hiểu được. Hãy xem cách một Hành động có thể xử lý các ví dụ trước đó đối với yêu cầu dự báo thời tiết.

Hình 1. So khớp ý định NLU

Để tra cứu thông tin dự báo thời tiết, có thể bạn cần một vài thông tin, như thời gian người dùng muốn nhận thông tin dự báo và vị trí của họ. Tuy nhiên, như chúng tôi đã đề cập trước đó, mỗi người dùng có thể yêu cầu thông tin dự đoán theo những cách khác nhau. Trợ lý có thể hiểu được những khác biệt này và chuyển đổi thành ý định chuẩn của người dùng để nhận thông tin dự đoán. Sau đó, công cụ này có thể phân tích cú pháp yêu cầu của người dùng để biết dữ liệu thích hợp mà bạn cần để thực hiện yêu cầu. Trong trường hợp này, đó là thời gian và vị trí mong muốn của người dùng cho thông tin dự báo thời tiết. Cuối cùng, bạn có thể sử dụng dữ liệu này để tra cứu thông tin thời tiết bằng một API REST công khai và trả về thông tin thời tiết cho người dùng dưới dạng lời nhắc.

Thời điểm xây dựng

Thao tác trò chuyện phù hợp nhất với các trường hợp sử dụng đơn giản cho phép người dùng hoàn thành công việc nhanh chóng cũng như cho các trường hợp sử dụng sống động và chuyển tiếp bằng giọng nói. Hành động trò chuyện hợp lý thường thuộc các danh mục chung sau:

  • Những câu trả lời mà mọi người có thể dễ dàng trả lời. Những hành động có thể thực hiện bằng cách nhập thông tin quen thuộc như thời gian hoặc ngày tháng, chẳng hạn như đặt vé máy bay.
  • Thao tác nhanh chóng nhưng hữu ích. Những giải pháp này thường mang lại cho người dùng lợi ích ngay lập tức mà chỉ tốn rất ít thời gian, chẳng hạn như tìm hiểu xem đội thể thao họ yêu thích sẽ thi đấu tiếp theo khi nào.
  • Những hành động vốn phù hợp hơn với giọng nói. Đây thường là những việc mà bạn muốn mà không cần dùng tay, chẳng hạn như nhận huấn luyện trong khi tập yoga hoặc tập thể dục nhẹ nhàng hoặc một trò chơi được thiết kế để tương tác ưu tiên bằng giọng nói.

Cách xây dựng

Actions on Google cho phép bạn tạo Hành động trò chuyện bằng SDK Actions, Trình tạo hành động hoặc cả hai có thể thay thế cho nhau. Tính năng này cho phép bạn chọn quy trình phát triển phù hợp nhất với nhu cầu của mình, đồng thời cho phép bạn linh hoạt chuyển đổi qua lại khi cần.

SDK Hành động cung cấp một giản đồ chuẩn dựa trên tệp để xây dựng Hành động, thư viện để tương tác với Trợ lý và CLI để triển khai và quản lý dự án Hành động của bạn. Trình tạo Actions được xây dựng dựa trên công nghệ giống như SDK Actions và cho phép bạn tạo bằng IDE mạnh mẽ và dễ sử dụng.

Hãy xem phần Tổng quan về bản dựng để biết thêm thông tin.

Các bước tiếp theo

Hãy xem các tài nguyên sau để bắt đầu xây dựng ngay bây giờ:

  • Hướng dẫn bắt đầu nhanh – Giới thiệu nhanh về cách thiết lập môi trường và bắt đầu phát triển bằng SDK Hành động và Trình tạo.
  • Lớp học lập trình – Lớp học lập trình cung cấp hướng dẫn chi tiết và chuyên sâu về cách xây dựng Actions cho Trợ lý Google.
  • Mẫu – Tải tất cả các mẫu của chúng tôi trên GitHub để bắt đầu thử nghiệm ngay bây giờ.