Las APIs de IA generativa de ML Kit aprovechan la potencia de Gemini Nano para ayudar a tus apps a realizar tareas. Estas APIs proporcionan calidad lista para usar para casos de uso populares a través de una interfaz de alto nivel. Las APIs de IA generativa de ML Kit se compilan sobre AICore, un servicio del sistema Android que permite la ejecución integrado en el dispositivo de modelos de base de IA generativa para facilitar funciones como las funcionalidades de la app y la privacidad del usuario mejorada mediante el procesamiento de datos de forma local.
Las Condiciones del Servicio Adicionales de la API de IA generativa de ML Kit se aplican al uso de las APIs de IA generativa. Los desarrolladores son los únicos responsables de la seguridad de su cliente de API y de la experiencia del usuario de su app.
Características clave
Las APIs de IA generativa de ML Kit admiten las siguientes funciones:
- Resumen: Resume artículos o conversaciones de chat como una lista con viñetas.
- Revisión: Perfecciona el contenido breve refinando la gramática y corrigiendo errores de ortografía.
- Reescritura: Reescribe mensajes breves en diferentes tonos o estilos.
- **Descripción de imágenes**: Genera una breve descripción de una imagen determinada.
- Reconocimiento de voz: Transcribe contenido de audio a texto.
- Instrucción: Genera contenido de texto basado en una instrucción personalizada solo de texto o multimodal.
Beneficios de las APIs de IA generativa
Al igual que otras funciones existentes de ML Kit, las APIs de IA generativa se ejecutan por completo integrado en el dispositivo y, por lo tanto, proporcionan los siguientes beneficios:
- Los datos de entrada, inferencia y salida se procesan de forma local.
- La funcionalidad sigue siendo la misma sin una conexión a Internet confiable.
- No se incurre en costos adicionales del servidor por cada llamada a la API.
Además, como las APIs de IA generativa se compilan sobre AICore y están potenciadas por Gemini Nano, cada app puede usar el modelo compartido de Gemini Nano que se encuentra en el dispositivo. Esto evita la necesidad de esperar a que se descargue un modelo si ya existe en un dispositivo y, a su vez, conserva espacio de almacenamiento. Obtén más información sobre cómo AICore aísla las solicitudes para proteger la privacidad.
Transmisión versus no transmisión
Las APIs de IA generativa de ML Kit ofrecen opciones de transmisión y no transmisión para recibir resultados. La API de transmisión entrega respuestas de forma incremental a medida que se generan, lo que proporciona un flujo continuo de datos. Por el contrario, la API de no transmisión espera hasta que se complete toda la respuesta antes de devolverla como un solo bloque.
Elige la API de transmisión para respuestas largas, ya que permite obtener comentarios iniciales más rápidos. La API de no transmisión es más adecuada para respuestas breves o cuando se procesan resultados en lotes.
Dispositivos compatibles
Las APIs específicas de funciones de IA generativa (resumen, revisión, reescritura y descripción de imágenes) tienen una compatibilidad con dispositivos diferente a la de la API de Prompt, como se describe en las siguientes secciones.
Compatibilidad con dispositivos de la API específica de funciones
Las APIs de resumen, revisión, reescritura y descripción de imágenes están disponibles en los siguientes dispositivos, con planes para expandir la compatibilidad a dispositivos adicionales:
- Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
- Honor: Honor 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro, Magic V5
- iQOO: iQOO 13, iQOO 15
- Lenovo: Lenovo Idea Tab Pro Gen 2, Lenovo Legion Tab Gen 5(8.8")
- Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
- OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13, OnePlus 13s
- OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
- POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
- realme: realme GT 7 Pro, realme GT 7T
- Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold
- vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
- Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini
La disponibilidad de la compatibilidad con idiomas específicos puede variar según la configuración del dispositivo en particular y los modelos que se descargaron en el dispositivo.
Compatibilidad con dispositivos de la API de Prompt
La API de Prompt es compatible con los siguientes dispositivos:
nano-v2 |
|
nano-v3 |
|
Compatibilidad con dispositivos de la API de Speech Recognition
La API de Speech Recognition es compatible con los siguientes dispositivos:
| Modo básico | Usa el modelo tradicional de reconocimiento de voz integrado en el dispositivo, disponible en la mayoría de los dispositivos Android con el nivel de API 31 y versiones posteriores. |
|---|---|
| Modo avanzado | Aprovecha el modelo de IA generativa para obtener una mayor calidad y una cobertura de idiomas más amplia. Es compatible con los dispositivos Pixel 10, y se están desarrollando más dispositivos. |
Recupera la versión de Gemini Nano
Las diferentes versiones de Gemini Nano se ejecutan en diferentes dispositivos. Para mostrar la versión de Gemini Nano en un dispositivo, usa getBaseModelName().
Cuota por aplicación
AICore aplica una cuota de inferencia por app. Si realizas demasiadas solicitudes a la API de IA generativa en un período breve, se mostrará una respuesta ErrorCode.BUSY. Cuando recibas este error, considera usar la retirada exponencial para reintentar la solicitud. Además, se puede mostrar ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED si una app excede una cuota de larga duración (p.ej., cuota diaria).
Uso en segundo plano
La inferencia de la API de IA generativa solo se permite cuando la app es la aplicación principal en primer plano. Si usas la API cuando la app no está en primer plano, incluido el uso de un servicio en primer plano, se mostrará una respuesta ErrorCode.BACKGROUND_USE_BLOCKED.
Código de muestra
Para obtener este código, consulta las siguientes muestras: