Quando passi un'immagine a ML Kit, questo rileva fino a cinque oggetti nell'immagine e la posizione di ciascun oggetto. Durante il rilevamento degli oggetti nei flussi video, ogni oggetto ha un ID univoco che può essere utilizzato per tracciare l'oggetto da un frame all'altro.
Puoi utilizzare un modello di classificazione delle immagini personalizzato per classificare gli oggetti che vengono rilevati. Consulta Modelli personalizzati con ML Kit per linee guida sui requisiti di compatibilità dei modelli, dove trovare i modelli preaddestrati e come addestrare i tuoi modelli.
Esistono due modi per integrare un modello personalizzato. Puoi raggruppare il modello inserendolo nella cartella degli asset dell'app oppure scaricarlo dinamicamente da Firebase. La tabella seguente mette a confronto le due opzioni.
Modello in bundle | Modello ospitato |
---|---|
Il modello fa parte dell'APK dell'app, che ne aumenta le dimensioni. | Il modello non fa parte dell'APK. L'hosting avviene tramite caricamento su Firebase Machine Learning. |
Il modello è subito disponibile, anche quando il dispositivo Android è offline | Il modello viene scaricato on demand |
Non è necessario un progetto Firebase | Richiede un progetto Firebase |
Devi ripubblicare la tua app per aggiornare il modello | Esegui il push degli aggiornamenti del modello senza ripubblicare l'app |
Nessun test A/B integrato | Semplici test A/B con Firebase Remote Config |
Prova
- Consulta l'app di guida rapida di Vision per un esempio di utilizzo del modello in bundle e l'app di avvio rapido di AutoML per un esempio di utilizzo del modello ospitato.
- Consulta l'app Material Design Showcase per un'implementazione end-to-end di questa API.
Prima di iniziare
Nel file
build.gradle
a livello di progetto, assicurati di includere il Repository Maven di Google in entrambe le sezionibuildscript
eallprojects
.Aggiungi le dipendenze per le librerie Android di ML Kit al file gradle a livello di app del tuo modulo, che di solito è
app/build.gradle
:Per raggruppare un modello con la tua app:
dependencies { // ... // Object detection & tracking feature with custom bundled model implementation 'com.google.mlkit:object-detection-custom:17.0.1' }
Per scaricare in modo dinamico un modello da Firebase, aggiungi la dipendenza
linkFirebase
:dependencies { // ... // Object detection & tracking feature with model downloaded // from firebase implementation 'com.google.mlkit:object-detection-custom:17.0.1' implementation 'com.google.mlkit:linkfirebase:17.0.0' }
Se vuoi scaricare un modello, assicurati di aggiungere Firebase al progetto Android se non l'hai ancora fatto. Questa operazione non è necessaria quando raccogli il modello.
1. Carica il modello
Configura l'origine di un modello locale
Per raggruppare il modello con la tua app:
Copia il file del modello (che di solito termina con
.tflite
o.lite
) nella cartellaassets/
dell'app. Potrebbe essere necessario creare prima la cartella facendo clic con il tasto destro del mouse sulla cartellaapp/
e poi facendo clic su Nuovo > Cartella > Cartella Asset.Poi, aggiungi quanto segue al file
build.gradle
dell'app per assicurarti che Gradle non comprima il file del modello durante la creazione dell'app:android { // ... aaptOptions { noCompress "tflite" // or noCompress "lite" } }
Il file del modello sarà incluso nel pacchetto dell'app e disponibile per ML Kit come asset non elaborato.
Crea l'oggetto
LocalModel
, specificando il percorso del file del modello:Kotlin
val localModel = LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute file path to model file) // or .setUri(URI to model file) .build()
Java
LocalModel localModel = new LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute file path to model file) // or .setUri(URI to model file) .build();
Configura un'origine del modello ospitata da Firebase
Per utilizzare il modello ospitato in remoto, crea un oggetto CustomRemoteModel
mediante FirebaseModelSource
, specificando il nome assegnato al modello quando lo hai pubblicato:
Kotlin
// Specify the name you assigned in the Firebase console. val remoteModel = CustomRemoteModel .Builder(FirebaseModelSource.Builder("your_model_name").build()) .build()
Java
// Specify the name you assigned in the Firebase console. CustomRemoteModel remoteModel = new CustomRemoteModel .Builder(new FirebaseModelSource.Builder("your_model_name").build()) .build();
Poi avvia l'attività di download del modello, specificando le condizioni in cui vuoi consentire il download. Se il modello non è presente sul dispositivo o se è disponibile una versione più recente del modello, l'attività scaricherà il modello in modo asincrono da Firebase:
Kotlin
val downloadConditions = DownloadConditions.Builder() .requireWifi() .build() RemoteModelManager.getInstance().download(remoteModel, downloadConditions) .addOnSuccessListener { // Success. }
Java
DownloadConditions downloadConditions = new DownloadConditions.Builder() .requireWifi() .build(); RemoteModelManager.getInstance().download(remoteModel, downloadConditions) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(@NonNull Task task) { // Success. } });
Molte app avviano l'attività di download nel codice di inizializzazione, ma puoi farlo in qualsiasi momento prima di utilizzare il modello.
2. Configura il rilevatore di oggetti
Dopo aver configurato le origini del modello, configura il rilevatore di oggetti per il tuo caso d'uso con un oggetto CustomObjectDetectorOptions
. Puoi modificare le seguenti impostazioni:
Impostazioni rilevatore di oggetti | |
---|---|
Modalità di rilevamento |
STREAM_MODE (valore predefinito) | SINGLE_IMAGE_MODE
In In |
Rileva e monitora più oggetti |
false (valore predefinito) | true
Indica se rilevare e tracciare fino a cinque oggetti o solo l'oggetto più in evidenza (impostazione predefinita). |
Classificare gli oggetti |
false (valore predefinito) | true
Indica se classificare o meno gli oggetti rilevati utilizzando il modello di classificazione personalizzato fornito. Per utilizzare il tuo modello di classificazione personalizzato, devi impostarlo su |
Soglia di confidenza della classificazione |
Punteggio di affidabilità minimo delle etichette rilevate. Se non viene impostata, verrà utilizzata qualsiasi soglia del classificatore specificata dai metadati del modello. Se il modello non contiene metadati o se i metadati non specificano una soglia di classificazione, verrà utilizzata una soglia predefinita pari a 0,0. |
Numero massimo di etichette per oggetto |
Numero massimo di etichette per oggetto che il rilevatore restituirà. Se non viene configurato, verrà utilizzato il valore predefinito 10. |
L'API di rilevamento e monitoraggio degli oggetti è ottimizzata per questi due casi d'uso principali:
- Rilevamento e tracciamento in tempo reale dell'oggetto più in evidenza nel mirino della fotocamera.
- Il rilevamento di più oggetti da un'immagine statica.
Per configurare l'API per questi casi d'uso, con un modello bundle localmente:
Kotlin
// Live detection and tracking val customObjectDetectorOptions = CustomObjectDetectorOptions.Builder(localModel) .setDetectorMode(CustomObjectDetectorOptions.STREAM_MODE) .enableClassification() .setClassificationConfidenceThreshold(0.5f) .setMaxPerObjectLabelCount(3) .build() // Multiple object detection in static images val customObjectDetectorOptions = CustomObjectDetectorOptions.Builder(localModel) .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE) .enableMultipleObjects() .enableClassification() .setClassificationConfidenceThreshold(0.5f) .setMaxPerObjectLabelCount(3) .build() val objectDetector = ObjectDetection.getClient(customObjectDetectorOptions)
Java
// Live detection and tracking CustomObjectDetectorOptions customObjectDetectorOptions = new CustomObjectDetectorOptions.Builder(localModel) .setDetectorMode(CustomObjectDetectorOptions.STREAM_MODE) .enableClassification() .setClassificationConfidenceThreshold(0.5f) .setMaxPerObjectLabelCount(3) .build(); // Multiple object detection in static images CustomObjectDetectorOptions customObjectDetectorOptions = new CustomObjectDetectorOptions.Builder(localModel) .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE) .enableMultipleObjects() .enableClassification() .setClassificationConfidenceThreshold(0.5f) .setMaxPerObjectLabelCount(3) .build(); ObjectDetector objectDetector = ObjectDetection.getClient(customObjectDetectorOptions);
Se hai un modello ospitato in remoto, devi verificare che sia stato scaricato prima di eseguirlo. Puoi controllare lo stato dell'attività
di download del modello utilizzando il metodo isModelDownloaded()
del gestore modelli.
Anche se devi confermare questo aspetto prima di eseguire il rilevatore, se disponi sia di un modello ospitato in remoto sia di un modello in bundle localmente, potrebbe essere opportuno eseguire questo controllo quando crei un'istanza del rilevatore di immagini: crea un rilevatore dal modello remoto se è stato scaricato e dal modello locale in caso contrario.
Kotlin
RemoteModelManager.getInstance().isModelDownloaded(remoteModel) .addOnSuccessListener { isDownloaded -> val optionsBuilder = if (isDownloaded) { CustomObjectDetectorOptions.Builder(remoteModel) } else { CustomObjectDetectorOptions.Builder(localModel) } val customObjectDetectorOptions = optionsBuilder .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE) .enableClassification() .setClassificationConfidenceThreshold(0.5f) .setMaxPerObjectLabelCount(3) .build() val objectDetector = ObjectDetection.getClient(customObjectDetectorOptions) }
Java
RemoteModelManager.getInstance().isModelDownloaded(remoteModel) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(Boolean isDownloaded) { CustomObjectDetectorOptions.Builder optionsBuilder; if (isDownloaded) { optionsBuilder = new CustomObjectDetectorOptions.Builder(remoteModel); } else { optionsBuilder = new CustomObjectDetectorOptions.Builder(localModel); } CustomObjectDetectorOptions customObjectDetectorOptions = optionsBuilder .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE) .enableClassification() .setClassificationConfidenceThreshold(0.5f) .setMaxPerObjectLabelCount(3) .build(); ObjectDetector objectDetector = ObjectDetection.getClient(customObjectDetectorOptions); } });
Se hai solo un modello ospitato in remoto, devi disattivare le funzionalità correlate al modello, ad esempio disattivare o nascondere parte dell'interfaccia utente fino a quando non confermi che il modello è stato scaricato. Per farlo, collega un listener al metodo download()
del gestore dei modelli:
Kotlin
RemoteModelManager.getInstance().download(remoteModel, conditions) .addOnSuccessListener { // Download complete. Depending on your app, you could enable the ML // feature, or switch from the local model to the remote model, etc. }
Java
RemoteModelManager.getInstance().download(remoteModel, conditions) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(Void v) { // Download complete. Depending on your app, you could enable // the ML feature, or switch from the local model to the remote // model, etc. } });
3. Prepara l'immagine di input
Crea un oggettoInputImage
dall'immagine.
Il rilevatore di oggetti viene eseguito direttamente da un ByteBuffer
Bitmap
, NV21 o un media.Image
YUV_420_888. Ti consigliamo di creare un InputImage
da queste origini
se hai accesso diretto a una di queste origini. Se crei un elemento InputImage
da altre origini, ci occuperemo noi della conversione internamente e potrebbe essere meno efficiente.
Puoi creare un oggetto InputImage
da origini diverse, illustrate di seguito.
Uso di un media.Image
Per creare un oggetto InputImage
da un oggetto media.Image
, ad esempio quando acquisisci un'immagine dalla fotocamera di un dispositivo, trasmetti l'oggetto media.Image
e la rotazione dell'immagine a InputImage.fromMediaImage()
.
Se utilizzi la libreria
FotocameraX, le classi OnImageCapturedListener
e ImageAnalysis.Analyzer
calcolano automaticamente il valore di rotazione.
Kotlin
private class YourImageAnalyzer : ImageAnalysis.Analyzer { override fun analyze(imageProxy: ImageProxy) { val mediaImage = imageProxy.image if (mediaImage != null) { val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees) // Pass image to an ML Kit Vision API // ... } } }
Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { @Override public void analyze(ImageProxy imageProxy) { Image mediaImage = imageProxy.getImage(); if (mediaImage != null) { InputImage image = InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees()); // Pass image to an ML Kit Vision API // ... } } }
Se non utilizzi una raccolta della fotocamera che mostra il grado di rotazione dell'immagine, puoi calcolarlo in base al grado di rotazione del dispositivo e all'orientamento del sensore della fotocamera nel dispositivo:
Kotlin
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 0) ORIENTATIONS.append(Surface.ROTATION_90, 90) ORIENTATIONS.append(Surface.ROTATION_180, 180) ORIENTATIONS.append(Surface.ROTATION_270, 270) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // Get the device's sensor orientation. val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360 } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360 } return rotationCompensation }
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 0); ORIENTATIONS.append(Surface.ROTATION_90, 90); ORIENTATIONS.append(Surface.ROTATION_180, 180); ORIENTATIONS.append(Surface.ROTATION_270, 270); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // Get the device's sensor orientation. CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360; } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360; } return rotationCompensation; }
Quindi, passa l'oggetto media.Image
e il
valore del grado di rotazione a InputImage.fromMediaImage()
:
Kotlin
val image = InputImage.fromMediaImage(mediaImage, rotation)
Java
InputImage image = InputImage.fromMediaImage(mediaImage, rotation);
Utilizzare l'URI di un file
Per creare un oggetto InputImage
da un URI del file, passa il contesto dell'app e l'URI del file a
InputImage.fromFilePath()
. Questo è utile quando
utilizzi un intent ACTION_GET_CONTENT
per richiedere all'utente di selezionare
un'immagine dall'app Galleria.
Kotlin
val image: InputImage try { image = InputImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
Java
InputImage image; try { image = InputImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
Con ByteBuffer
o ByteArray
Per creare un oggetto InputImage
da un oggetto ByteBuffer
o ByteArray
, calcola prima il grado di rotazione dell'immagine come descritto in precedenza per l'input media.Image
.
Quindi, crea l'oggetto InputImage
con il buffer o l'array, insieme ad altezza, larghezza, formato di codifica del colore e grado di rotazione dell'immagine:
Kotlin
val image = InputImage.fromByteBuffer( byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ) // Or: val image = InputImage.fromByteArray( byteArray, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 )
Java
InputImage image = InputImage.fromByteBuffer(byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ); // Or: InputImage image = InputImage.fromByteArray( byteArray, /* image width */480, /* image height */360, rotation, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 );
Uso di un Bitmap
Per creare un oggetto InputImage
da un oggetto Bitmap
, effettua la seguente dichiarazione:
Kotlin
val image = InputImage.fromBitmap(bitmap, 0)
Java
InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);
L'immagine è rappresentata da un oggetto Bitmap
con gradi di rotazione.
4. Esegui il rilevatore di oggetti
Kotlin
objectDetector .process(image) .addOnFailureListener(e -> {...}) .addOnSuccessListener(results -> { for (detectedObject in results) { // ... } });
Java
objectDetector .process(image) .addOnFailureListener(e -> {...}) .addOnSuccessListener(results -> { for (DetectedObject detectedObject : results) { // ... } });
5. Recuperare informazioni sugli oggetti etichettati
Se la chiamata a process()
ha esito positivo, viene passato un elenco di DetectedObject
al listener di operazione riuscita.
Ogni DetectedObject
contiene le seguenti proprietà:
Riquadro di delimitazione | Un Rect che indica la posizione dell'oggetto nell'immagine. |
||||||
ID monitoraggio | Un numero intero che identifica l'oggetto nelle immagini. Null in SINGLE_IMAGE_MODE. | ||||||
Etichette |
|
Kotlin
// The list of detected objects contains one item if multiple // object detection wasn't enabled. for (detectedObject in results) { val boundingBox = detectedObject.boundingBox val trackingId = detectedObject.trackingId for (label in detectedObject.labels) { val text = label.text val index = label.index val confidence = label.confidence } }
Java
// The list of detected objects contains one item if multiple // object detection wasn't enabled. for (DetectedObject detectedObject : results) { Rect boundingBox = detectedObject.getBoundingBox(); Integer trackingId = detectedObject.getTrackingId(); for (Label label : detectedObject.getLabels()) { String text = label.getText(); int index = label.getIndex(); float confidence = label.getConfidence(); } }
Garantire un'ottima esperienza utente
Per un'esperienza utente ottimale, segui queste linee guida nella tua app:
- Il corretto rilevamento degli oggetti dipende dalla complessità visiva dell'oggetto. Per essere rilevati, gli oggetti con un numero ridotto di caratteristiche visive potrebbero dover occupare una parte più ampia dell'immagine. Fornisci agli utenti indicazioni su come acquisire input che funzionino bene con il tipo di oggetti che vuoi rilevare.
- Quando utilizzi la classificazione, se vuoi rilevare oggetti che non rientrano perfettamente nelle categorie supportate, implementa una gestione speciale per gli oggetti sconosciuti.
Scopri anche l'app ML Kit Material Design per la vetrina e la raccolta Pattern per funzionalità basate sul machine learning di Material Design.
Miglioramento delle prestazioni
Se vuoi utilizzare il rilevamento di oggetti in un'applicazione in tempo reale, segui queste linee guida per ottenere le frequenze fotogrammi migliori:Quando utilizzi la modalità flusso in un'applicazione in tempo reale, non utilizzare il rilevamento di più oggetti, poiché la maggior parte dei dispositivi non sarà in grado di produrre frequenze fotogrammi adeguate.
- Se utilizzi l'API
Camera
ocamera2
, limita le chiamate al rilevatore. Se un nuovo frame video diventa disponibile mentre il rilevatore è in esecuzione, rilascialo. Per un esempio, consulta la classeVisionProcessorBase
nell'app di esempio della guida rapida. - Se utilizzi l'API
CameraX
, assicurati che la strategia di contropressione sia impostata sul valore predefinitoImageAnalysis.STRATEGY_KEEP_ONLY_LATEST
. Ciò garantisce che verrà inviata per l'analisi una sola immagine alla volta. Se vengono prodotte più immagini quando l'analizzatore è occupato, queste verranno eliminate automaticamente e non verranno inserite nella coda per l'invio. Dopo aver chiuso l'immagine analizzata chiamando ImageProxy.close(), verrà pubblicata la successiva immagine più recente. - Se utilizzi l'output del rilevatore per sovrapporre gli elementi grafici all'immagine di input, recupera prima il risultato da ML Kit, quindi esegui il rendering dell'immagine e dell'overlay in un solo passaggio. Il rendering viene eseguito sulla piattaforma di visualizzazione una sola volta per ogni frame di input. Per un esempio, consulta le classi
CameraSourcePreview
eGraphicOverlay
nell'app di esempio della guida rapida. - Se utilizzi l'API Camera2, acquisisci le immagini in formato
ImageFormat.YUV_420_888
. Se utilizzi l'API Camera precedente, acquisisci le immagini in formatoImageFormat.NV21
.