Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Etichettatura delle immagini

Con le API di etichettatura delle immagini di ML Kit puoi rilevare ed estrarre informazioni sulle entità in un'immagine in un ampio gruppo di categorie. Il modello predefinito di etichettatura delle immagini è in grado di identificare oggetti, luoghi, attività, specie animali, prodotti e altro ancora.

Puoi anche utilizzare un modello di classificazione delle immagini personalizzato per personalizzare il rilevamento in base a un caso d'uso specifico. Per ulteriori informazioni, consulta la pagina Utilizzo di un modello TensorFlow Lite personalizzato.

Funzionalità chiave

  • Un potente classificatore di base per uso generico Riconosce più di 400 categorie che descrivono gli oggetti più comuni nelle foto.
  • Personalizza i tuoi casi d'uso con i modelli personalizzati Utilizza altri modelli preaddestrati di TensorFlow Hub o il tuo modello personalizzato addestrato con TensorFlow, AutoML Vision Edge o TensorFlow Lite Model Maker.
  • API di alto livello facili da utilizzare Non devi preoccuparti di input/output del modello di basso livello, pre- e post-elaborazione delle immagini o per creare una pipeline di elaborazione. ML Kit estrae le etichette dal modello TensorFlow Lite e le fornisce come descrizione del testo.

Tieni presente che questa API è destinata ai modelli di classificazione delle immagini che descrivono l'immagine completa. Per classificare uno o più oggetti in un'immagine, ad esempio scarpe o mobili, l'API Rilevamento di oggetti e monitoraggio potrebbe essere più adatta.

Modelli di classificazione delle immagini supportati

Le API Image Labeling supportano diversi modelli di classificazione delle immagini:

Modelli di classificazione delle immagini supportati
Modello di base Per impostazione predefinita, l'API utilizza un potente modello di etichettatura delle immagini per uso generico che riconosce più di 400 entità che coprono i concetti più comuni nelle foto.
Modelli TensorFlow Lite personalizzati Per scegliere come target concetti specifici delle applicazioni, l'API accetta modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Questi possono essere modelli preaddestrati scaricati da TensorFlow Hub o i tuoi modelli addestrati con AutoML Vision Edge, TensorFlow Lite Model Maker o TensorFlow stesso. I modelli possono essere abbinati alla tua app o ospitati in Firebase Machine Learning e scaricati in fase di esecuzione.

Utilizzo del modello di base

Il modello di base di ML Kit restituisce un elenco di entità che identificano persone, cose, luoghi, attività e così via. Ogni entità fornisce un punteggio che indica la certezza che il modello di machine learning ha nella sua pertinenza. Con queste informazioni, puoi eseguire attività come la generazione automatica di metadati e la moderazione dei contenuti. Il modello predefinito fornito con ML Kit riconosce più di 400 entità diverse.

iOS Android

Etichette di esempio

Il modello di base nell'API Image Labeling supporta più di 400 etichette, come i seguenti esempi:

CategoriaEtichette di esempio
Persone Crowd
Selfie
Smile
Attività Dancing
Eating
Surfing
Cose Car
Piano
Receipt
Animali Bird
Cat
Dog
Piante Flower
Fruit
Vegetable
Luoghi Beach
Lake
Mountain

Risultati di esempio

Di seguito è riportato un esempio delle entità riconosciute nella foto associata.

Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Etichetta 0
Testo Stadio
Fiducia 0,9205354
Etichetta 1
Testo Sport
Fiducia 0,7531109
Etichetta 2
Testo Evento
Fiducia 0,66905296
Etichetta 3
Testo Tempo libero
Fiducia 0,59904146
Etichetta 4
Testo Calcio
Fiducia 0,56384534
Etichetta 5
Testo Netta
Fiducia 0,54679185
Etichetta 6
Testo Pianta
Fiducia 0,524364

Utilizzo di un modello TensorFlow Lite personalizzato

Il modello di etichettatura delle immagini di base di ML Kit è progettato per un uso generico. È addestrato a riconoscere 400 categorie che descrivono gli oggetti più comuni nelle foto. La tua app potrebbe avere bisogno di un modello di classificazione delle immagini specializzato che riconosca un numero più ristretto di categorie, ad esempio un modello che distingue le varie specie di fiori e le tipologie di alimenti.

Questa API consente di adattare il modello a un particolare caso d'uso supportando modelli personalizzati di classificazione di immagini da una vasta gamma di origini. Per ulteriori informazioni, consulta Modelli personalizzati con ML Kit. I modelli personalizzati possono essere abbinati alla tua app o scaricati in modo dinamico dal cloud utilizzando il servizio di deployment dei modelli di Firebase Machine Learning.

iOS Android

Pre-elaborazione immagine di input

Se necessario, Etichettatura immagine utilizza il ridimensionamento e l'allungamento delle immagini bilineali per regolare le dimensioni dell'immagine di input e le proporzioni in modo che soddisfino i requisiti del modello sottostante.