Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Com as APIs de rotulagem de imagens do Kit de ML, é possível detectar e extrair informações
sobre entidades em uma imagem em um amplo grupo de categorias. O modelo
padrão de rotulagem de imagens pode identificar objetos gerais, lugares, atividades, espécies
animais, produtos e muito mais.
Também é possível usar um modelo de classificação de imagem personalizado para adaptar a detecção a um caso de uso específico. Consulte Como usar um modelo personalizado do TensorFlow Lite
para mais informações.
Principais recursos
Um classificador base de uso geral avançado
Reconhece mais de 400 categorias que descrevem os objetos mais encontrados nas
fotos.
Adapte-se ao seu caso de uso com modelos personalizados
Use outros modelos pré-treinados do TensorFlow Hub ou seu próprio modelo personalizado treinado
com o TensorFlow, o AutoML Vision Edge ou o TensorFlow Lite Model Maker.
APIs de alto nível e fáceis de usar
Não é necessário lidar com entrada/saída de modelos de baixo nível, pré e
pós-processamento de imagens nem com a criação de um pipeline de processamento. O kit de ML extrai os
rótulos do modelo do TensorFlow Lite e os fornece como uma descrição de texto.
Essa API é destinada a modelos de classificação de imagem que descrevem a
imagem completa. Para classificar um ou mais objetos em uma imagem, como sapatos ou peças de móvel, a API Object Detection & Tracking pode ser mais adequada.
Modelos de classificação de imagem compatíveis
As APIs Image Labeling oferecem suporte a diferentes modelos de classificação de imagem:
Modelos de classificação de imagem compatíveis
Modelo base
Por padrão, a API usa um eficiente modelo de rotulagem de imagens
de uso geral que reconhece mais de 400 entidades que
abrangem os conceitos mais encontrados nas fotos.
Modelos personalizados do TensorFlow Lite
Para ser direcionada a conceitos específicos do aplicativo, a API
aceita modelos de classificação de imagem personalizados de uma grande
variedade de origens. Eles podem ser modelos pré-treinados
transferidos por download do TensorFlow Hub ou seus próprios modelos treinados
com o AutoML Vision Edge, o TensorFlow Lite Model Maker ou o próprio
TensorFlow. Os modelos podem ser incluídos no seu app ou hospedados com o Firebase Machine Learning e
transferidos por download no ambiente de execução.
Como usar o modelo base
O modelo base do Kit de ML retorna uma lista de entidades que identificam pessoas, coisas, lugares, atividades e assim por diante. Cada entidade vem com uma pontuação que indica a confiança do modelo de ML na relevância. Com essas
informações, é possível executar tarefas como geração automática de metadados e
moderação de conteúdo. O modelo padrão fornecido com o Kit de ML reconhece mais de
400 entidades diferentes.
O modelo base na API de rotulagem de imagens aceita mais de 400 rótulos, como nos exemplos a seguir:
Categoria
Exemplos de rótulos
Pessoas
Crowd Selfie Smile
Atividades
Dancing Eating Surfing
Android Things
Car Piano Receipt
Animais
Bird Cat Dog
Plantas
Flower Fruit Vegetable
Places
Beach Lake Mountain
Resultados de exemplo
Confira um exemplo das entidades que foram reconhecidas na foto complementar.
Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Rótulo 0
Texto
Estádio
Confiança
0,9205354
Rótulo 1
Texto
Esportes
Confiança
0,7531109
Rótulo 2
Texto
Evento
Confiança
0,66905296
Rótulo 3
Texto
Lazer
Confiança
0,59904146
Rótulo 4
Texto
Futebol
Confiança
0,56384534
Rótulo 5
Texto
Rede
Confiança
0,54679185
Rótulo 6
Texto
Planta
Confiança
0,524364
Como usar um modelo personalizado do TensorFlow Lite
O modelo de rotulagem de imagens básico do Kit de ML foi criado para uso geral. Ele é
treinado para reconhecer 400 categorias que descrevem os objetos mais
encontrados nas fotos. Seu app pode precisar de um modelo de classificação de imagem especializado
que reconheça um número mais estreito de categorias com mais detalhes, como um modelo
que distingue entre espécies de flores ou tipos de alimento.
Essa API permite adaptar a um caso de uso específico, oferecendo suporte a modelos de classificação de imagem personalizados de uma ampla variedade de origens. Consulte Modelos personalizados com o Kit de ML para saber mais. Os modelos personalizados podem ser empacotados com seu aplicativo ou baixados dinamicamente da nuvem usando o serviço de implantação de modelos do Firebase Machine Learning.
Se necessário, a rotulagem de imagens usa dimensionamento e alongamento bilineares para ajustar
o tamanho e a proporção da imagem de entrada de modo que ela atenda aos requisitos do
modelo subjacente.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[[["\u003cp\u003eML Kit's image labeling APIs can detect and extract information about entities in an image, including objects, places, activities, and more.\u003c/p\u003e\n"],["\u003cp\u003eYou can leverage the powerful base model to identify over 400 common entities or use custom models tailored to specific use cases.\u003c/p\u003e\n"],["\u003cp\u003eML Kit simplifies the process with high-level APIs that abstract away low-level model complexities, making integration easier.\u003c/p\u003e\n"],["\u003cp\u003eEasily incorporate custom TensorFlow Lite models, whether bundled with your app or dynamically downloaded, to enable specialized image classification.\u003c/p\u003e\n"],["\u003cp\u003eImage Labeling automatically adjusts the input image size and aspect ratio to fit the model's requirements.\u003c/p\u003e\n"]]],[],null,["With ML Kit's image labeling APIs you can detect and extract information\nabout entities in an image across a broad group of categories. The default\nimage labeling model can identify general objects, places, activities, animal\nspecies, products, and more.\n\nYou can also use a custom image classification model to tailor detection\nto a specific use case. See [Using a custom TensorFlow Lite model](#custom-tflite)\nfor more information.\n\nKey capabilities\n\n- **A powerful general-purpose base classifier** Recognizes more than 400 categories that describe the most commonly found objects in photos.\n- **Tailor to your use case with custom models** Use other pre-trained models from TensorFlow Hub or your own custom model trained with TensorFlow, AutoML Vision Edge or TensorFlow Lite Model maker.\n- **Easy-to-use high-level APIs** No need to deal with low-level model input/output, image pre- and post-processing, or building a processing pipeline. ML Kit extracts the labels from the TensorFlow Lite model and provides them as a text description.\n\nNote that this API is intended for image classification models that describe the\nfull image. For classifying one or more objects in an image, such as shoes or\npieces of furniture, the\n[Object Detection \\& Tracking](/ml-kit/vision/object-detection)\nAPI may be a better fit.\n\nSupported image classification models\n\nThe Image Labeling APIs support different image classification models:\n\n| Supported image classification models ||\n|-----------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| **Base model** | By default the API uses a powerful general-purpose image labeling model that recognizes more than 400 entities that cover the most commonly-found concepts in photos. |\n| **Custom TensorFlow Lite models** | To target application-specific concepts, the API accepts custom image classification models from a wide range of sources. These can be pre-trained models downloaded from TensorFlow Hub or your own models trained with AutoML Vision Edge, TensorFlow Lite Model Maker or TensorFlow itself. Models can be bundled with your app or hosted with Firebase Machine Learning and downloaded at run-time. |\n\nUsing the base model\n\nML Kit's base model returns a list of entities that identify people,\nthings, places, activities, and so on. Each entity comes with a score that\nindicates the confidence the ML model has in its relevance. With this\ninformation, you can perform tasks such as automatic metadata generation and\ncontent moderation. The default model provided with ML Kit recognizes more than\n[400 different entities](/ml-kit/vision/image-labeling/label-map).\n\n[iOS](/ml-kit/vision/image-labeling/ios)\n[Android](/ml-kit/vision/image-labeling/android)\n\nExample labels\n\nThe base model in the image labeling API supports 400+ labels, such as the\nfollowing examples:\n\n| Category | Example labels |\n|------------|------------------------------|\n| People | `Crowd` `Selfie` `Smile` |\n| Activities | `Dancing` `Eating` `Surfing` |\n| Things | `Car` `Piano` `Receipt` |\n| Animals | `Bird` `Cat` `Dog` |\n| Plants | `Flower` `Fruit` `Vegetable` |\n| Places | `Beach` `Lake` `Mountain` |\n\nExample results\n\nHere is an example of the entities that were recognized in the accompanying photo.\nPhoto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0\n\n| Label 0 ||\n|----------------|------------|\n| **Text** | Stadium |\n| **Confidence** | 0.9205354 |\n| **Text** | Sports |\n| **Confidence** | 0.7531109 |\n| **Text** | Event |\n| **Confidence** | 0.66905296 |\n| **Text** | Leisure |\n| **Confidence** | 0.59904146 |\n| **Text** | Soccer |\n| **Confidence** | 0.56384534 |\n| **Text** | Net |\n| **Confidence** | 0.54679185 |\n| **Text** | Plant |\n| **Confidence** | 0.524364 |\n\nUsing a custom TensorFlow Lite model\n\nML Kit's base image labeling model is built for general-purpose use. It's\ntrained to recognize 400 categories that describe the most commonly-found\nobjects in photos. Your app might need a specialized image classification model\nthat recognizes a narrower number of categories in more detail, such as a model\nthat distinguishes between species of flowers or types of food.\n\nThis API lets you tailor to a particular use case by supporting custom image\nclassification models from a wide range of sources. Please refer to [Custom models with ML Kit](/ml-kit/custom-models)\nto learn more. Custom models can be bundled with your app or dynamically\ndownloaded from the cloud using Firebase Machine Learning's Model deployment\nservice.\n\n[iOS](/ml-kit/vision/image-labeling/custom-models/ios)\n[Android](/ml-kit/vision/image-labeling/custom-models/android)\n\nInput image preprocessing\n\nIf needed, Image Labeling uses bilinear image scaling and stretching to adjust\nthe input image size and aspect ratio so that they fit the requirements of the\nunderlying model."]]