Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Etiquetado de imágenes

Con las APIs de etiquetado de imágenes de ML Kit, puedes detectar y extraer información sobre entidades en una imagen en un amplio grupo de categorías. El modelo predeterminado de etiquetado de imágenes puede identificar objetos generales, lugares, actividades, especies de animales, productos y mucho más.

También puedes usar un modelo de clasificación de imágenes personalizado para adaptar la detección a un caso de uso específico. Consulta Cómo usar un modelo de LiteRT personalizado para obtener más información.

Funciones clave

Un potente clasificador base de uso general Reconoce más de 400 categorías que describen los objetos que se encuentran con mayor frecuencia en las fotos.
Adapta los modelos personalizados a tu caso de uso Usa otros modelos previamente entrenados de TensorFlow Hub o tu propio modelo personalizado entrenado con TensorFlow, AutoML o LiteRT.
APIs de alto nivel fáciles de usar: No es necesario ocuparse de la entrada o salida del modelo de bajo nivel, el preprocesamiento o posprocesamiento de imágenes, ni la creación de una canalización de procesamiento. ML Kit extrae las etiquetas del modelo de LiteRT y las proporciona como una descripción de texto.

Ten en cuenta que esta API está diseñada para modelos de clasificación de imágenes que describen la imagen completa. Para clasificar uno o más objetos en una imagen, como zapatos o muebles, la API de Detección y seguimiento de objetos puede ser una mejor opción.

Modelos de clasificación de imágenes compatibles

Las APIs de Image Labeling admiten diferentes modelos de clasificación de imágenes:

Modelos de clasificación de imágenes compatibles
Modelo base	De forma predeterminada, la API usa un potente modelo de etiquetado de imágenes de uso general que reconoce más de 400 entidades que abarcan los conceptos que se encuentran con más frecuencia en las fotos.
Modelos personalizados de LiteRT	Para segmentar conceptos específicos de la aplicación, la API acepta modelos personalizados de clasificación de imágenes de una amplia variedad de fuentes. Pueden ser modelos previamente entrenados descargados de TensorFlow Hub o tus propios modelos entrenados con AutoML, LiteRT o TensorFlow. Los modelos se pueden incluir en tu app o alojar con Cloud Storage y descargarse en el tiempo de ejecución.

Modelos de clasificación de imágenes compatibles

Modelo base

De forma predeterminada, la API usa un potente modelo de etiquetado de imágenes de uso general que reconoce más de 400 entidades que abarcan los conceptos que se encuentran con más frecuencia en las fotos.

Modelos personalizados de LiteRT

Para segmentar conceptos específicos de la aplicación, la API acepta modelos personalizados de clasificación de imágenes de una amplia variedad de fuentes. Pueden ser modelos previamente entrenados descargados de TensorFlow Hub o tus propios modelos entrenados con AutoML, LiteRT o TensorFlow. Los modelos se pueden incluir en tu app o alojar con Cloud Storage y descargarse en el tiempo de ejecución.

Cómo usar el modelo base

El modelo base de ML Kit devuelve una lista de entidades que identifican personas, objetos, lugares, actividades y mucho más. Cada entidad incluye una puntuación que indica la confianza que tiene el modelo de AA en su relevancia. Con esta información, puedes realizar tareas como la generación automática de metadatos y la moderación de contenido. El modelo predeterminado que se proporciona con ML Kit reconoce más de 400 entidades diferentes.

iOS Android

Ejemplo de etiquetas

El modelo base de la API de etiquetado de imágenes admite más de 400 etiquetas, como las de los siguientes ejemplos:

Categoría	Ejemplo de etiquetas
Personas	`Crowd` `Selfie` `Smile`
Actividades	`Dancing` `Eating` `Surfing`
Cosas	`Car` `Piano` `Receipt`
Animales	`Bird` `Cat` `Dog`
Plantas	`Flower` `Fruit` `Vegetable`
Lugares	`Beach` `Lake` `Mountain`

Resultados de ejemplo

Este es un ejemplo de las entidades que se reconocieron en la foto adjunta.

Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0

Etiqueta 0
Texto	Estadio
Confianza	0.9205354
Etiqueta 1
Texto	Deportes
Confianza	0.7531109
Etiqueta 2
Texto	Evento
Confianza	0.66905296
Etiqueta 3
Texto	Ocio
Confianza	0.59904146
Etiqueta 4
Texto	Fútbol
Confianza	0.56384534
Etiqueta 5
Texto	Neta
Confianza	0.54679185
Etiqueta 6
Texto	Planta
Confianza	0.524364

Cómo usar un modelo personalizado de LiteRT

El modelo básico de etiquetado de imágenes de ML Kit está diseñado para un uso general. Se entrenó para reconocer 400 categorías que describen los objetos que se encuentran con mayor frecuencia en las fotos. Es posible que tu app necesite un modelo de clasificación de imágenes especializado que reconozca una cantidad más limitada de categorías con mayor detalle, como un modelo que distinga entre especies de flores o tipos de comida.

Esta API te permite adaptarte a un caso de uso en particular, ya que admite modelos personalizados de clasificación de imágenes de una amplia variedad de fuentes. Consulta Modelos personalizados con ML Kit para obtener más información. Los modelos personalizados se pueden incluir en tu app o descargar de forma dinámica desde Cloud Storage.

iOS Android

Procesamiento previo de la imagen de entrada

Si es necesario, el etiquetado de imágenes usa el ajuste de escala y el estiramiento bilineal de imágenes para ajustar el tamaño y la relación de aspecto de la imagen de entrada de modo que cumplan con los requisitos del modelo subyacente.

Etiquetado de imágenes Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Funciones clave

Modelos de clasificación de imágenes compatibles

Cómo usar el modelo base

Ejemplo de etiquetas

Resultados de ejemplo

Cómo usar un modelo personalizado de LiteRT

Procesamiento previo de la imagen de entrada

Etiquetado de imágenes