API GenAI của Bộ công cụ học máy khai thác sức mạnh của Gemini Nano để giúp ứng dụng của bạn thực hiện các nhiệm vụ. Các API này cung cấp chất lượng sẵn có cho các trường hợp sử dụng phổ biến thông qua một giao diện cấp cao. API GenAI của Bộ công cụ học máy được xây dựng dựa trên AICore, một dịch vụ hệ thống Android cho phép thực thi các mô hình nền tảng AI tạo sinh trên thiết bị để hỗ trợ các tính năng như chức năng của ứng dụng nâng cao và cải thiện quyền riêng tư của người dùng bằng cách xử lý dữ liệu cục bộ.
Điều khoản dịch vụ bổ sung của API GenAI của Bộ công cụ học máy áp dụng cho việc sử dụng các API GenAI. Nhà phát triển hoàn toàn chịu trách nhiệm về sự an toàn của ứng dụng khách API và trải nghiệm người dùng của ứng dụng.
Các tính năng chính
API GenAI của Bộ công cụ học máy hỗ trợ các tính năng sau:
- Tóm tắt: Tóm tắt bài viết hoặc cuộc trò chuyện dưới dạng danh sách có dấu đầu dòng.
- Hiệu đính: Trau chuốt nội dung ngắn bằng cách tinh chỉnh ngữ pháp và sửa lỗi chính tả.
- Viết lại: Viết lại tin nhắn ngắn theo nhiều giọng điệu hoặc phong cách.
- **Mô tả hình ảnh**: Tạo nội dung mô tả ngắn về một hình ảnh nhất định.
- Nhận dạng lời nói: Chuyển nội dung âm thanh thành văn bản.
- Câu lệnh: Tạo nội dung văn bản dựa trên câu lệnh tuỳ chỉnh chỉ có văn bản hoặc câu lệnh đa phương thức.
Lợi ích của API GenAI
Tương tự như các tính năng hiện có khác của Bộ công cụ học máy, API GenAI chạy hoàn toàn trên thiết bị và do đó mang lại những lợi ích sau:
- Dữ liệu đầu vào, suy luận và đầu ra được xử lý cục bộ
- Chức năng vẫn giữ nguyên mà không cần kết nối Internet đáng tin cậy
- Không phát sinh thêm chi phí máy chủ cho mỗi lệnh gọi API
Ngoài ra, vì API GenAI được xây dựng dựa trên AICore và được hỗ trợ bởi Gemini Nano, nên mọi ứng dụng đều có thể sử dụng mô hình Gemini Nano dùng chung trên thiết bị. Điều này giúp bạn không cần phải đợi tải xuống mô hình nếu mô hình đó đã tồn tại trên thiết bị, đồng thời tiết kiệm không gian lưu trữ. Tìm hiểu thêm về cách AICore cô lập các yêu cầu để bảo vệ quyền riêng tư.
Truyền trực tuyến so với không truyền trực tuyến
API GenAI của Bộ công cụ học máy cung cấp cả tuỳ chọn truyền trực tuyến và không truyền trực tuyến để nhận kết quả. API truyền trực tuyến phân phối các phản hồi theo từng bước khi chúng được tạo, cung cấp luồng dữ liệu liên tục. Ngược lại, API không truyền trực tuyến sẽ đợi cho đến khi toàn bộ phản hồi hoàn tất rồi mới trả về dưới dạng một khối duy nhất.
Hãy chọn API truyền trực tuyến cho các phản hồi dài, vì API này cho phép phản hồi ban đầu nhanh hơn. API không truyền trực tuyến phù hợp hơn cho các phản hồi ngắn hoặc khi xử lý kết quả theo lô.
Hỗ trợ về thiết bị
Các API dành riêng cho tính năng GenAI (Tóm tắt, Sửa lỗi chính tả và ngữ pháp, Viết lại và Mô tả hình ảnh) có phạm vi hỗ trợ thiết bị khác với API Câu lệnh, như mô tả trong các phần sau.
Hỗ trợ thiết bị cho API dành riêng cho tính năng
Các API Tóm tắt, Sửa lỗi chính tả và ngữ pháp, Viết lại và Mô tả hình ảnh có trên các thiết bị sau đây, với kế hoạch mở rộng phạm vi hỗ trợ cho các thiết bị khác:
- Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
- Honor: Honor 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro, Magic V5
- iQOO: iQOO 13, iQOO 15
- Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
- OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13, OnePlus 13s
- OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
- POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
- realme: realme GT 7 Pro, realme GT 7T
- Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold
- vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
- Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini
Phạm vi hỗ trợ ngôn ngữ cụ thể có thể thay đổi tuỳ thuộc vào cấu hình của thiết bị cụ thể và các mô hình đã được tải xuống thiết bị.
Hỗ trợ thiết bị cho API câu lệnh
API câu lệnh được hỗ trợ trên các thiết bị sau:
nano-v2 |
|
nano-v3 |
|
Hỗ trợ thiết bị cho API Nhận dạng lời nói
API Nhận dạng lời nói được hỗ trợ trên các thiết bị sau:
| Chế độ cơ bản | Sử dụng mô hình nhận dạng lời nói truyền thống trên thiết bị, có trên hầu hết các thiết bị Android có cấp độ API 31 trở lên. |
|---|---|
| Chế độ nâng cao | Tận dụng mô hình GenAI để có chất lượng cao hơn và phạm vi ngôn ngữ rộng hơn. Được hỗ trợ bởi các thiết bị Pixel 10, với nhiều thiết bị đang được phát triển. |
Truy xuất phiên bản Gemini Nano
Các phiên bản Gemini Nano khác nhau chạy trên các thiết bị khác nhau. Để trả về phiên bản Gemini Nano trên một thiết bị, hãy sử dụng getBaseModelName().
Hạn mức cho mỗi ứng dụng
AICore thực thi hạn mức suy luận cho mỗi ứng dụng. Việc đưa ra quá nhiều yêu cầu API GenAI trong một khoảng thời gian ngắn sẽ dẫn đến phản hồi ErrorCode.BUSY. Khi nhận được lỗi như vậy, hãy cân nhắc sử dụng thời gian đợi luỹ thừa để thử lại yêu cầu. Ngoài ra, ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED có thể được trả về nếu một ứng dụng vượt quá hạn mức dài hạn (ví dụ: hạn mức hằng ngày).
Sử dụng trong nền
Chỉ được phép suy luận API GenAI khi ứng dụng là ứng dụng trên nền trước hàng đầu. Việc sử dụng API khi ứng dụng không ở trên nền trước, bao gồm cả việc sử dụng dịch vụ trên nền trước, sẽ dẫn đến phản hồi ErrorCode.BACKGROUND_USE_BLOCKED.
Mã mẫu
Để lấy mã này, hãy xem các mẫu sau: