Panoramica delle API ML Kit GenAI

Le API di AI generativa di ML Kit sfruttano la potenza di Gemini Nano per aiutare le tue app a eseguire attività. Queste API forniscono una qualità predefinita per i casi d'uso più comuni tramite un'interfaccia di alto livello. Le API di AI generativa di ML Kit sono basate su AICore, un servizio di sistema Android che consente l'esecuzione su dispositivo di modelli di base di AI generativa per facilitare funzionalità come la funzionalità avanzata delle app e una maggiore privacy degli utenti elaborando i dati localmente.

I Termini di servizio aggiuntivi dell'API di AI generativa di ML Kit si applicano all'utilizzo delle API di AI generativa. Gli sviluppatori sono gli unici responsabili della sicurezza del client API e dell'esperienza utente della propria app.

Funzionalità principali

Le API di AI generativa di ML Kit supportano le seguenti funzionalità:

  • Riassunto: riassumi articoli o conversazioni di chat come elenco puntato.
  • Correzione di bozze: perfeziona i contenuti brevi migliorando la grammatica e correggendo gli errori di ortografia.
  • Riscrittura: riscrivi messaggi brevi in toni o stili diversi.
  • Descrizione dell'immagine: genera una breve descrizione di un'immagine specifica.
  • Riconoscimento vocale: trascrivi i contenuti audio in testo.
  • Prompt: genera contenuti di testo in base a un prompt personalizzato solo di testo o multimodale.

Vantaggi delle API di AI generativa

Analogamente ad altre funzionalità di ML Kit esistenti, le API di AI generativa vengono eseguite interamente sul dispositivo e pertanto offrono i seguenti vantaggi:

  • I dati di input, inferenza e output vengono elaborati localmente
  • La funzionalità rimane la stessa senza una connessione a internet affidabile
  • Non sono previsti costi aggiuntivi del server per ogni chiamata API

Inoltre, poiché le API di AI generativa sono basate su AICore e utilizzano Gemini Nano, ogni app è in grado di utilizzare il modello Gemini Nano condiviso presente sul dispositivo. In questo modo, non è necessario attendere il download di un modello se esiste già su un dispositivo e, a sua volta, si risparmia spazio di archiviazione. Scopri di più su come AICore isola le richieste per proteggere la privacy.

Streaming e non streaming

Le API di AI generativa di ML Kit offrono opzioni di streaming e non streaming per la ricezione dei risultati. L'API di streaming fornisce risposte in modo incrementale man mano che vengono generate, fornendo un flusso continuo di dati. Al contrario, l'API non di streaming attende che l'intera risposta sia completa prima di restituirla come un singolo blocco.

Scegli l'API di streaming per le risposte lunghe, in quanto consente un feedback iniziale più rapido. L'API non di streaming è più adatta per risposte brevi o per l'elaborazione dei risultati in batch.

Assistenza per i dispositivi

Le API specifiche per le funzionalità di AI generativa (Riassunto, Correzione di bozze, Riscrittura e Descrizione dell'immagine) hanno un supporto per i dispositivi diverso rispetto all'API Prompt, come descritto nelle sezioni seguenti.

Supporto per i dispositivi dell'API specifica per le funzionalità

Le API Riassunto, Correzione di bozze, Riscrittura e Descrizione dell'immagine sono disponibili sui seguenti dispositivi, con l'intenzione di espandere il supporto ad altri dispositivi:

  • Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Honor 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro, Magic V5
  • iQOO: iQOO 13, iQOO 15
  • Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
  • OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13, OnePlus 13s
  • OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
  • POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
  • realme: realme GT 7 Pro, realme GT 7T
  • Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold
  • vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
  • Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini

La disponibilità del supporto linguistico specifico può variare a seconda della configurazione del dispositivo e dei modelli scaricati sul dispositivo.

Supporto per i dispositivi dell'API Prompt

L'API Prompt è supportata sui seguenti dispositivi:

nano-v2

  • Google: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Magic V5, Magic 7, Magic 7 Pro
  • iQOO: iQOO 13
  • Motorola: Razr 60 Ultra, Razr Ultra 2025
  • OnePlus: OnePlus 13, OnePlus 13s
  • OPPO: Find N5
  • POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
  • realme: realme GT 7 Pro
  • Samsung: Galaxy Z Fold7, Galaxy Z TriFold
  • Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini
  • vivo: vivo X200 FE, vivo T4 Ultra

nano-v3

  • Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold
  • Honor: Honor Magic 8 Pro
  • iQOO: iQOO 15
  • Samsung: Galaxy S26, Galaxy S26+, Galaxy S26 Ultra
  • Motorola: Signature
  • OnePlus: OnePlus 15, OnePlus 15R
  • OPPO: Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
  • realme: realme GT 7T
  • vivo: vivo X200T, vivo X200, vivo X200 Pro, vivo X300, vivo X300 Pro

Supporto per i dispositivi dell'API Speech Recognition

L'API Speech Recognition è supportata sui seguenti dispositivi:

Modalità di base Utilizza il modello di riconoscimento vocale tradizionale sul dispositivo, disponibile sulla maggior parte dei dispositivi Android con livello API 31 e versioni successive.
Modalità avanzata Sfrutta il modello di AI generativa per una qualità superiore e una copertura linguistica più ampia. Supportato dai dispositivi Pixel 10, con altri dispositivi in fase di sviluppo.

Recuperare la versione di Gemini Nano

Versioni diverse di Gemini Nano vengono eseguite su dispositivi diversi. Per restituire la versione di Gemini Nano su un dispositivo, utilizza getBaseModelName().

Quota per applicazione

AICore applica una quota di inferenza per app. Se effettui troppe richieste API di AI generativa in un breve periodo di tempo, riceverai una risposta ErrorCode.BUSY. Quando ricevi un errore di questo tipo, valuta la possibilità di utilizzare il backoff esponenziale per riprovare a inviare la richiesta. Inoltre, se un'app supera una quota di lunga durata (ad es. la quota giornaliera), può essere restituito ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED.

Utilizzo in background

L'inferenza dell'API di AI generativa è consentita solo quando l'app è l'applicazione in primo piano principale. L'utilizzo dell'API quando l'app non è in primo piano, incluso l'utilizzo di un servizio in primo piano, genera una risposta ErrorCode.BACKGROUND_USE_BLOCKED.

Codice campione

Per ottenere questo codice, consulta gli esempi seguenti: