Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Detección y seguimiento de objetos

Con la API de detección y seguimiento de objetos en el dispositivo de ML Kit, puedes detectar y hacer un seguimiento de objetos en una imagen o en el feed de una cámara en vivo.

De manera opcional, puedes clasificar los objetos detectados con el clasificador grueso integrado en la API o con tu propio modelo personalizado de clasificación de imágenes. Consulta Cómo usar un modelo de LiteRT personalizado para obtener más información.

Debido a que la detección y el seguimiento de objetos se realizan en el dispositivo, funciona bien como frontend de la canalización de búsqueda visual. Después de detectar y filtrar objetos, puedes pasarlos a un backend en la nube, como Cloud Vision Product Search.

iOS Android

Funciones clave

Detección y seguimiento rápido de objetos Detecta objetos y obtén sus ubicaciones en la imagen. Haz un seguimiento de los objetos en los fotogramas de imágenes sucesivos.
Modelo integrado en el dispositivo optimizado El modelo de detección de objetos y seguimiento está optimizado para dispositivos móviles y fue diseñado para usarse en aplicaciones en tiempo real, incluso en dispositivos de gama baja.
Detección de objetos prominentes Determina automáticamente el objeto más prominente en una imagen.
Clasificación ordinaria Clasifica los objetos en categorías amplias, que puedes usar para filtrar objetos que no te interesan. Se admiten las siguientes categorías: artículos para el hogar, artículos de moda, alimentos, plantas y lugares.
Clasificación con un modelo personalizado Usa tu propio modelo de clasificación de imágenes personalizado para identificar o filtrar categorías de objetos específicos. Para que tu modelo personalizado funcione mejor, omite el fondo de la imagen.

Resultados de ejemplo

Haz un seguimiento del objeto más prominente en las imágenes

En el siguiente ejemplo, se muestran los datos de seguimiento de tres fotogramas sucesivos con el clasificador grueso predeterminado que proporciona ML Kit.

ID de seguimiento	0
Límites	(95, 45), (496, 45), (496, 240), (95, 240)
Categoría	PLACE
Confianza de la clasificación	0.9296875

ID de seguimiento	0
Límites	(84, 46), (478, 46), (478, 247), (84, 247)
Categoría	PLACE
Confianza de la clasificación	0.8710938

ID de seguimiento	0
Límites	(53, 45), (519, 45), (519, 240), (53, 240)
Categoría	PLACE
Confianza de la clasificación	0.8828125

Foto: Christian Ferrer [CC BY-SA 4.0]

Múltiples objetos en una imagen estática

En el siguiente ejemplo, se muestran los datos de los cuatro objetos detectados en la imagen con el clasificador grueso predeterminado que proporciona ML Kit.

Zapatos

Objeto 0
Límites	(1, 97), (332, 97), (332, 332), (1, 332)
Categoría	FASHION_GOOD
Confianza de la clasificación	0.95703125
Objeto 1
Límites	(186, 80), (337, 80), (337, 226), (186, 226)
Categoría	FASHION_GOOD
Confianza de la clasificación	0.84375
Objeto 2
Límites	(296, 80), (472, 80), (472, 388), (296, 388)
Categoría	FASHION_GOOD
Confianza de la clasificación	0.94921875
Objeto 3
Límites	(439, 83), (615, 83), (615, 306), (439, 306)
Categoría	FASHION_GOOD
Confianza de la clasificación	0.9375

Cómo usar un modelo personalizado de LiteRT

El clasificador grueso predeterminado se compila para cinco categorías, lo que proporciona información limitada sobre los objetos detectados. Es posible que necesites un modelo de clasificación más especializado que abarque un dominio de conceptos más limitado y detallado, por ejemplo, un modelo para distinguir entre especies de flores o tipos de comida.

Esta API te permite adaptarte a un caso de uso en particular, ya que admite modelos personalizados de clasificación de imágenes de una amplia variedad de fuentes. Consulta Modelos personalizados con ML Kit para obtener más información. Los modelos personalizados se pueden incluir en tu app o descargar de forma dinámica desde Cloud Storage.