Invia richieste personalizzate a Gemini Nano con l'API GenAI Prompt

Con l'API GenAI Prompt di ML Kit, puoi inviare richieste in linguaggio naturale sul dispositivo a Gemini Nano. L'API GenAI Prompt accetta un input di testo o un input combinato di immagine e testo ed emette un output di testo.

Puoi utilizzare l'API GenAI Prompt per una serie di casi d'uso, tra cui i seguenti:

Caso d'uso

Esempio

Comprensione delle immagini

Analisi delle foto per la classificazione, ad esempio "animali domestici", "cibo" o "viaggi".

Traduzioni brevi

Traduzione di messaggi brevi tra un autista addetto alle consegne e un cliente.

Riepilogo guidato

Riassumere le recensioni di un ristorante in base a un interesse specifico dell'utente.

Estrazione di entità

Estrazione di dettagli importanti su un evento imminente da un thread email.

Ispirazione per la generazione di contenuti

Suggerimenti per gli inviti per una voce del journal.

Scansione intelligente dei documenti

Estrazione e classificazione degli articoli da un'immagine della ricevuta.

Classificazione del testo

Classificazione delle recensioni dei clienti in una categoria positiva, neutra o negativa.

API Prompt e API specifiche per funzionalità

Le API ML Kit GenAI esistenti supportano i casi d'uso Riepilogo, Correzione bozze, Riscrittura e Descrizione immagine, supportati anche dall'API Prompt. La tabella seguente illustra i vantaggi di ciascuna opzione:

Considerazione

API Prompt

API specifiche per funzionalità

Impegno di integrazione

Alto.

Richiede più impegno per l'implementazione, a causa dell'ingegneria dei prompt e della garanzia della qualità.

stress.

Richiedono meno impegno, in quanto queste API sono già ottimizzate per casi d'uso specifici. Non è necessario interagire direttamente con l'LLM.

Flessibilità

Maggiore flessibilità, in quanto puoi personalizzare il prompt.

Meno flessibilità. Ogni API ha un fine-tuning fisso e un prompt integrato con le seguenti caratteristiche:

  • I riepiloghi possono essere composti solo da 1-3 punti elenco.
  • La descrizione dell'immagine è generica e breve.
  • La riscrittura supporta solo stili predefiniti.

Come regola generale, utilizza l'API Prompt quando hai bisogno di maggiore personalizzazione e flessibilità e utilizza le API specifiche delle funzionalità per le attività standard che non richiedono una logica complessa.

Codice di esempio