Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Rilevamento e monitoraggio degli oggetti

Con l'API di rilevamento di oggetti e monitoraggio on-device di ML Kit, puoi rilevare e monitorare gli oggetti in un'immagine o in un feed videocamera in tempo reale.

Facoltativamente, puoi classificare gli oggetti rilevati utilizzando il classificatore grossolano integrato nell'API o il tuo modello di classificazione delle immagini personalizzato. Per ulteriori informazioni, consulta Utilizzare un modello LiteRT personalizzato per ulteriori informazioni.

Poiché il rilevamento di oggetti e il monitoraggio avvengono sul dispositivo, funziona bene come frontend della pipeline di ricerca visiva. Dopo aver rilevato e filtrato gli oggetti, puoi passarli a un backend cloud, ad esempio Cloud Vision Product Search.

iOS Android

Funzionalità chiave

Rilevamento di oggetti e monitoraggio rapidi Rileva gli oggetti e ottieni le loro posizioni nell'immagine. Monitora gli oggetti nei frame di immagini successivi.
Modello on-device ottimizzato Il modello di rilevamento di oggetti e monitoraggio è ottimizzato per i dispositivi mobili ed è destinato all'uso in applicazioni in tempo reale, anche su dispositivi di fascia bassa.
Rilevamento di oggetti in primo piano Determina automaticamente l'oggetto più in primo piano in un'immagine.
Classificazione grossolana Classifica gli oggetti in categorie ampie, che puoi utilizzare per filtrare gli oggetti che non ti interessano. Sono supportate le seguenti categorie: articoli per la casa, articoli di moda, cibo, piante e luoghi.
Classificazione con un modello personalizzato Utilizza il tuo modello di classificazione delle immagini personalizzato per identificare o filtrare categorie di oggetti specifiche. Migliora le prestazioni del tuo modello personalizzato escludendo lo sfondo dell'immagine.

Risultati di esempio

Monitoraggio dell'oggetto più in primo piano nelle immagini

L'esempio seguente mostra i dati di monitoraggio di tre frame successivi con il classificatore grossolano predefinito fornito da ML Kit.

ID monitoraggio	0
Limiti	(95, 45), (496, 45), (496, 240), (95, 240)
Categoria	PLACE
Affidabilità della classificazione	0.9296875

ID monitoraggio	0
Limiti	(84, 46), (478, 46), (478, 247), (84, 247)
Categoria	PLACE
Affidabilità della classificazione	0.8710938

ID monitoraggio	0
Limiti	(53, 45), (519, 45), (519, 240), (53, 240)
Categoria	PLACE
Affidabilità della classificazione	0.8828125

Foto: Christian Ferrer [CC BY-SA 4.0]

Più oggetti in un'immagine statica

L'esempio seguente mostra i dati dei quattro oggetti rilevati nell'immagine con il classificatore grossolano predefinito fornito da ML Kit.

Scarpe

Oggetto 0
Limiti	(1, 97), (332, 97), (332, 332), (1, 332)
Categoria	FASHION_GOOD
Affidabilità della classificazione	0.95703125
Oggetto 1
Limiti	(186, 80), (337, 80), (337, 226), (186, 226)
Categoria	FASHION_GOOD
Affidabilità della classificazione	0.84375
Oggetto 2
Limiti	(296, 80), (472, 80), (472, 388), (296, 388)
Categoria	FASHION_GOOD
Affidabilità della classificazione	0.94921875
Oggetto 3
Limiti	(439, 83), (615, 83), (615, 306), (439, 306)
Categoria	FASHION_GOOD
Affidabilità della classificazione	0.9375

Utilizzare un modello LiteRT personalizzato

Il classificatore grossolano predefinito è creato per cinque categorie e fornisce informazioni limitate sugli oggetti rilevati. Potresti aver bisogno di un modello di classificatore più specializzato che copra un dominio di concetti più ristretto in modo più dettagliato, ad esempio un modello per distinguere tra specie di fiori o tipi di alimenti.

Questa API ti consente di adattare un caso d'uso specifico supportando modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Per saperne di più, consulta Modelli personalizzati con ML Kit. I modelli personalizzati possono essere inclusi nel pacchetto dell'app o scaricati dinamicamente da Cloud Storage.