Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Con le API di etichettatura delle immagini di ML Kit puoi rilevare ed estrarre informazioni
sulle entità in un'immagine in un ampio gruppo di categorie. Il modello di etichettatura delle immagini predefinito può identificare oggetti generici, luoghi, attività, specie animali, prodotti e altro ancora.
Puoi anche usare un modello di classificazione delle immagini
personalizzato per adattare il rilevamento a un caso d'uso specifico. Per ulteriori informazioni, consulta Utilizzo di un modello TensorFlow Lite personalizzato.
Funzionalità chiave
Un potente classificatore di base per uso generico
Riconosce oltre 400 categorie che descrivono gli oggetti più comuni nelle
foto.
Personalizzazione in base al tuo caso d'uso con i modelli personalizzati
Utilizza altri modelli preaddestrati di TensorFlow Hub o il tuo modello personalizzato addestrato con TensorFlow, AutoML Vision Edge o TensorFlow Lite Model Maker.
API di alto livello facili da utilizzare
Non devi preoccuparti di input/output di modelli di basso livello, pre- e post-elaborazione delle immagini o creazione di una pipeline di elaborazione. ML Kit estrae le etichette dal modello TensorFlow Lite e le fornisce come descrizione testuale.
Tieni presente che questa API è destinata ai modelli di classificazione delle immagini che descrivono l'immagine completa. Per classificare uno o più oggetti in un'immagine, come scarpe o mobili, l'API Object Detection & Tracking potrebbe essere più adatta.
Modelli di classificazione delle immagini supportati
Le API Image Labeling supportano diversi modelli di classificazione delle immagini:
Modelli di classificazione delle immagini supportati
Modello base
Per impostazione predefinita, l'API utilizza un potente modello di etichettatura delle immagini per uso generico che riconosce oltre 400 entità che coprono i concetti più comuni nelle foto.
Modelli TensorFlow Lite personalizzati
Per scegliere come target concetti specifici per l'applicazione, l'API accetta modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Possono essere modelli preaddestrati
scaricati da TensorFlow Hub o modelli personalizzati
addestrati con AutoML Vision Edge, TensorFlow Lite Model Maker o lo stesso
TensorFlow. I modelli possono essere abbinati alla tua app oppure ospitati con Firebase Machine Learning e scaricati in fase di runtime.
Utilizzo del modello di base
Il modello di base di ML Kit restituisce un elenco di entità
che identificano persone, cose, luoghi, attività e così via. Ogni entità è dotata di un punteggio che
indica il livello di affidabilità del modello ML nella sua pertinenza. Con queste informazioni puoi eseguire attività come la generazione automatica di metadati e la moderazione dei contenuti. Il modello predefinito fornito con ML Kit riconosce più di 400 entità diverse.
Il modello di base nell'API Image Labeling supporta oltre 400 etichette, tra cui
i seguenti esempi:
Categoria
Etichette di esempio
Persone
Crowd Selfie Smile
Attività
Dancing Eating Surfing
Cose
Car Piano Receipt
Animali
Bird Cat Dog
Piante
Flower Fruit Vegetable
Luoghi
Beach Lake Mountain
Risultati di esempio
Ecco un esempio delle entità riconosciute nella foto associata.
Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Etichetta 0
Testo
Stadio
Sicurezza di sé
0,9205354
Etichetta 1
Testo
Sport
Sicurezza di sé
0,7531109
Etichetta 2
Testo
Evento
Sicurezza di sé
0,66905296
Etichetta 3
Testo
Tempo libero
Sicurezza di sé
0,59904146
Etichetta 4
Testo
Calcio
Sicurezza di sé
0,56384534
Etichetta 5
Testo
Netta
Sicurezza di sé
0,54679185
Etichetta 6
Testo
Pianta
Sicurezza di sé
0,524364
Utilizzo di un modello TensorFlow Lite personalizzato
Il modello di etichettatura delle immagini di base di ML Kit è stato creato per un uso generico. È addestrato a riconoscere 400 categorie che descrivono gli oggetti più comuni nelle foto. La tua app potrebbe aver bisogno di un modello specializzato di classificazione delle immagini che riconosca in maggiore dettaglio un numero minore di categorie, ad esempio un modello che distingua specie di fiori o tipi di alimenti.
Questa API ti consente di adattare il sistema a un caso d'uso particolare supportando modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Per saperne di più, consulta Modelli personalizzati con ML Kit. I modelli personalizzati possono essere abbinati alla tua app o scaricati dinamicamente dal cloud utilizzando il servizio di deployment dei modelli di Firebase Machine Learning.
Se necessario, Image Labeling utilizza il ridimensionamento e lo stiramento dell'immagine bilineare per regolare
le dimensioni e le proporzioni dell'immagine di input in modo che si adattino ai requisiti del
modello sottostante.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eML Kit's image labeling APIs can detect and extract information about entities in an image, including objects, places, activities, and more.\u003c/p\u003e\n"],["\u003cp\u003eYou can leverage the powerful base model to identify over 400 common entities or use custom models tailored to specific use cases.\u003c/p\u003e\n"],["\u003cp\u003eML Kit simplifies the process with high-level APIs that abstract away low-level model complexities, making integration easier.\u003c/p\u003e\n"],["\u003cp\u003eEasily incorporate custom TensorFlow Lite models, whether bundled with your app or dynamically downloaded, to enable specialized image classification.\u003c/p\u003e\n"],["\u003cp\u003eImage Labeling automatically adjusts the input image size and aspect ratio to fit the model's requirements.\u003c/p\u003e\n"]]],[],null,["With ML Kit's image labeling APIs you can detect and extract information\nabout entities in an image across a broad group of categories. The default\nimage labeling model can identify general objects, places, activities, animal\nspecies, products, and more.\n\nYou can also use a custom image classification model to tailor detection\nto a specific use case. See [Using a custom TensorFlow Lite model](#custom-tflite)\nfor more information.\n\nKey capabilities\n\n- **A powerful general-purpose base classifier** Recognizes more than 400 categories that describe the most commonly found objects in photos.\n- **Tailor to your use case with custom models** Use other pre-trained models from TensorFlow Hub or your own custom model trained with TensorFlow, AutoML Vision Edge or TensorFlow Lite Model maker.\n- **Easy-to-use high-level APIs** No need to deal with low-level model input/output, image pre- and post-processing, or building a processing pipeline. ML Kit extracts the labels from the TensorFlow Lite model and provides them as a text description.\n\nNote that this API is intended for image classification models that describe the\nfull image. For classifying one or more objects in an image, such as shoes or\npieces of furniture, the\n[Object Detection \\& Tracking](/ml-kit/vision/object-detection)\nAPI may be a better fit.\n\nSupported image classification models\n\nThe Image Labeling APIs support different image classification models:\n\n| Supported image classification models ||\n|-----------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| **Base model** | By default the API uses a powerful general-purpose image labeling model that recognizes more than 400 entities that cover the most commonly-found concepts in photos. |\n| **Custom TensorFlow Lite models** | To target application-specific concepts, the API accepts custom image classification models from a wide range of sources. These can be pre-trained models downloaded from TensorFlow Hub or your own models trained with AutoML Vision Edge, TensorFlow Lite Model Maker or TensorFlow itself. Models can be bundled with your app or hosted with Firebase Machine Learning and downloaded at run-time. |\n\nUsing the base model\n\nML Kit's base model returns a list of entities that identify people,\nthings, places, activities, and so on. Each entity comes with a score that\nindicates the confidence the ML model has in its relevance. With this\ninformation, you can perform tasks such as automatic metadata generation and\ncontent moderation. The default model provided with ML Kit recognizes more than\n[400 different entities](/ml-kit/vision/image-labeling/label-map).\n\n[iOS](/ml-kit/vision/image-labeling/ios)\n[Android](/ml-kit/vision/image-labeling/android)\n\nExample labels\n\nThe base model in the image labeling API supports 400+ labels, such as the\nfollowing examples:\n\n| Category | Example labels |\n|------------|------------------------------|\n| People | `Crowd` `Selfie` `Smile` |\n| Activities | `Dancing` `Eating` `Surfing` |\n| Things | `Car` `Piano` `Receipt` |\n| Animals | `Bird` `Cat` `Dog` |\n| Plants | `Flower` `Fruit` `Vegetable` |\n| Places | `Beach` `Lake` `Mountain` |\n\nExample results\n\nHere is an example of the entities that were recognized in the accompanying photo.\nPhoto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0\n\n| Label 0 ||\n|----------------|------------|\n| **Text** | Stadium |\n| **Confidence** | 0.9205354 |\n| **Text** | Sports |\n| **Confidence** | 0.7531109 |\n| **Text** | Event |\n| **Confidence** | 0.66905296 |\n| **Text** | Leisure |\n| **Confidence** | 0.59904146 |\n| **Text** | Soccer |\n| **Confidence** | 0.56384534 |\n| **Text** | Net |\n| **Confidence** | 0.54679185 |\n| **Text** | Plant |\n| **Confidence** | 0.524364 |\n\nUsing a custom TensorFlow Lite model\n\nML Kit's base image labeling model is built for general-purpose use. It's\ntrained to recognize 400 categories that describe the most commonly-found\nobjects in photos. Your app might need a specialized image classification model\nthat recognizes a narrower number of categories in more detail, such as a model\nthat distinguishes between species of flowers or types of food.\n\nThis API lets you tailor to a particular use case by supporting custom image\nclassification models from a wide range of sources. Please refer to [Custom models with ML Kit](/ml-kit/custom-models)\nto learn more. Custom models can be bundled with your app or dynamically\ndownloaded from the cloud using Firebase Machine Learning's Model deployment\nservice.\n\n[iOS](/ml-kit/vision/image-labeling/custom-models/ios)\n[Android](/ml-kit/vision/image-labeling/custom-models/android)\n\nInput image preprocessing\n\nIf needed, Image Labeling uses bilinear image scaling and stretching to adjust\nthe input image size and aspect ratio so that they fit the requirements of the\nunderlying model."]]