Con la API de GenAI Prompt de ML Kit, puedes enviar solicitudes en lenguaje natural en el dispositivo a Gemini Nano. La API de GenAI Prompt acepta una entrada de texto o una entrada combinada de imagen y texto, y emite una salida de texto.
Puedes usar la API de GenAI Prompt para una variedad de casos de uso, incluidos los siguientes:
Caso práctico |
Ejemplo |
Comprensión de imágenes |
Analizar fotos para clasificarlas, por ejemplo, como "mascotas", "comida" o "viajes" |
Traducciones breves |
Traducir mensajes cortos entre un conductor de reparto y un cliente |
Resúmenes guiados |
Resumir opiniones sobre un restaurante según el interés específico de un usuario |
Extracción de entidades |
Extraer detalles importantes sobre un próximo evento de un hilo de correo electrónico |
Inspiración para la generación de contenido |
Sugerir mensajes para una entrada de diario |
Escaneo inteligente de documentos |
Extraer y categorizar elementos de la imagen de un recibo |
Clasificación de texto |
Clasificar las opiniones de los clientes en una categoría positiva, neutral o negativa |
Comparación entre la API de Prompt y las APIs específicas para funciones
Las APIs de IA generativa existentes de ML Kit admiten los casos de uso de resumen, corrección de pruebas, reescritura y descripción de imágenes, que también admite la API de Prompt. En la siguiente tabla, se describen los beneficios de cada una:
Consideración |
API de Prompt |
APIs específicas de funciones |
Esfuerzo de integración |
Alta. Requiere más esfuerzo para implementarse debido a la ingeniería de instrucciones y el control de calidad. |
tan llevaderos Requieren menos esfuerzo, ya que estas APIs ya están ajustadas para casos de uso específicos. No es necesario trabajar directamente con el LLM. |
Flexibilidad |
Mayor flexibilidad, ya que puedes diseñar la instrucción de forma personalizada. |
Menos flexibilidad Cada API tiene un ajuste fino fijo y una instrucción integrada con las siguientes características:
|
Como regla general, usa la API de Prompt cuando necesites más personalización y flexibilidad, y usa las APIs específicas de la función para tareas estándar que no requieren lógica compleja.