Có hai cách để tích hợp tính năng gắn nhãn hình ảnh với các mô hình tuỳ chỉnh: bằng cách gói quy trình dưới dạng một phần của ứng dụng hoặc bằng cách sử dụng quy trình không được gói phụ thuộc vào Dịch vụ Google Play. Nếu bạn chọn quy trình không đi kèm, ứng dụng của bạn sẽ nhỏ hơn. Hãy xem bảng sau đây để biết thông tin chi tiết.
| Theo cụm | Không đi kèm | |
|---|---|---|
| Tên thư viện | com.google.mlkit:image-labeling-custom | com.google.android.gms:play-services-mlkit-image-labeling-custom |
Triển khai | Pipeline được liên kết tĩnh với ứng dụng của bạn tại thời gian xây dựng. | Pipeline được tải xuống linh động bằng Dịch vụ Google Play. |
| Kích thước ứng dụng | Kích thước tăng khoảng 3,8 MB. | Kích thước tăng khoảng 200 KB. |
| Thời gian khởi chạy | Pipeline có sẵn ngay lập tức. | Có thể phải đợi quy trình tải xuống trước khi sử dụng lần đầu. |
| Giai đoạn vòng đời của API | Giai đoạn phát hành rộng rãi (GA) | Beta |
Có hai cách để tích hợp một mô hình tuỳ chỉnh: gói mô hình bằng cách đặt mô hình đó vào thư mục tài sản của ứng dụng hoặc tải mô hình đó xuống một cách linh hoạt từ Firebase. Bảng sau đây so sánh hai lựa chọn này.
| Mô hình theo gói | Mô hình được lưu trữ |
|---|---|
| Mô hình này là một phần trong APK của ứng dụng, làm tăng kích thước của ứng dụng. | Mô hình này không thuộc APK của bạn. Mô hình này được lưu trữ bằng cách tải lên Cloud Storage. Bạn nên sử dụng Cloud Storage cho Firebase. |
| Mô hình này có sẵn ngay lập tức, ngay cả khi thiết bị Android không có kết nối mạng | Ứng dụng của bạn phải có mã để tải mô hình xuống theo yêu cầu |
| Không cần dự án Firebase | Yêu cầu phải có dự án Firebase (nếu sử dụng Cloud Storage cho Firebase). |
| Bạn phải xuất bản lại ứng dụng để cập nhật mô hình | Đẩy các bản cập nhật mô hình mà không cần xuất bản lại ứng dụng |
| Không có thử nghiệm A/B tích hợp | Thử nghiệm A/B bằng Cấu hình từ xa Firebase |
Dùng thử
- Hãy xem ứng dụng bắt đầu nhanh về thị giác để biết ví dụ về cách sử dụng mô hình đi kèm và ứng dụng bắt đầu nhanh về AutoML để biết ví dụ về cách sử dụng mô hình được lưu trữ.
Trước khi bắt đầu
Trong tệp
build.gradle.ktscấp dự án, hãy nhớ thêm kho lưu trữ Maven của Google vào cả hai mụcbuildscriptvàallprojects.Thêm các phần phụ thuộc cho thư viện Android của Bộ công cụ học máy vào tệp gradle cấp ứng dụng của mô-đun, thường là
app/build.gradle.kts. Chọn một trong các phần phụ thuộc sau đây dựa trên nhu cầu của bạn:Để gói quy trình với ứng dụng của bạn:
dependencies { // ... // Use this dependency to bundle the pipeline with your app implementation("com.google.mlkit:image-labeling-custom:17.0.3") }Để sử dụng quy trình trong Dịch vụ Google Play:
dependencies { // ... // Use this dependency to use the dynamically downloaded pipeline in Google Play services implementation("com.google.android.gms:play-services-mlkit-image-labeling-custom:16.0.0-beta5") }Nếu chọn sử dụng quy trình trong Dịch vụ Google Play, bạn có thể định cấu hình ứng dụng để tự động tải quy trình xuống thiết bị sau khi ứng dụng được cài đặt từ Cửa hàng Play. Để thực hiện việc này, hãy thêm nội dung khai báo sau vào tệp
AndroidManifest.xmlcủa ứng dụng:<application ...> ... <meta-data android:name="com.google.mlkit.vision.DEPENDENCIES" android:value="custom_ica" /> <!-- To use multiple downloads: android:value="custom_ica,download2,download3" --> </application>Bạn cũng có thể kiểm tra rõ ràng phạm vi cung cấp của quy trình và yêu cầu tải xuống thông qua API ModuleInstallClient của Dịch vụ Google Play.
Nếu bạn không bật tính năng tải xuống quy trình tại thời điểm cài đặt hoặc yêu cầu tải xuống rõ ràng, thì quy trình sẽ được tải xuống vào lần đầu tiên bạn chạy trình gắn nhãn. Những yêu cầu bạn đưa ra trước khi quá trình tải xuống hoàn tất sẽ không mang lại kết quả.
Nếu bạn muốn tải một mô hình xuống bằng Cloud Storage cho Firebase, hãy đảm bảo rằng bạn thêm Firebase vào dự án Android (nếu chưa thực hiện). Bạn không bắt buộc phải làm việc này khi gói mô hình.
1. Tải mô hình
Bạn có thể tải mô hình từ một nguồn được gói cục bộ hoặc một nguồn được lưu trữ từ xa.
Định cấu hình nguồn mô hình cục bộ
Cách gói mô hình với ứng dụng của bạn:
Sao chép tệp mô hình (thường kết thúc bằng
.tflitehoặc.lite) vào thư mụcassets/của ứng dụng. (Trước tiên, bạn có thể cần tạo thư mục bằng cách nhấp chuột phải vào thư mụcapp/, sau đó nhấp vào New > Folder > Assets Folder (Mới > Thư mục > Thư mục thành phần)).Tạo đối tượng
LocalModel, chỉ định đường dẫn đến tệp mô hình:Kotlin
val localModel = LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute path to model file) // or .setUri(URI to model file) .build()
Java
LocalModel localModel = new LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute path to model file) // or .setUri(URI to model file) .build();
Định cấu hình nguồn mô hình được lưu trữ từ xa
Để sử dụng mô hình được lưu trữ từ xa, bạn phải tải tệp mô hình xuống bộ nhớ cục bộ của thiết bị bằng logic ứng dụng của riêng mình, rồi tải tệp đó dưới dạng mô hình cục bộ. Bạn nên sử dụng Cloud Storage cho Firebase để lưu trữ mô hình. Để biết thông tin chi tiết về cách triển khai, hãy xem Hướng dẫn di chuyển Firebase ML sang Cloud Storage.
Định cấu hình trình gắn nhãn hình ảnh
Sau khi bạn định cấu hình các nguồn mô hình, hãy tạo một đối tượng ImageLabeler từ một trong các nguồn đó.
Bạn có các tuỳ chọn sau đây:
| Tùy chọn | |
|---|---|
confidenceThreshold
|
Điểm tin cậy tối thiểu của nhãn được phát hiện. Nếu không được đặt, mọi ngưỡng phân loại do siêu dữ liệu của mô hình chỉ định sẽ được sử dụng. Nếu mô hình không chứa siêu dữ liệu hoặc siêu dữ liệu không chỉ định ngưỡng phân loại, thì ngưỡng mặc định là 0,0 sẽ được sử dụng. |
maxResultCount
|
Số lượng nhãn tối đa cần trả về. Nếu bạn không đặt, hệ thống sẽ sử dụng giá trị mặc định là 10. |
Nếu bạn chỉ có một mô hình được gói cục bộ, hãy tạo một trình gắn nhãn từ đối tượng LocalModel:
Kotlin
val customImageLabelerOptions = CustomImageLabelerOptions.Builder(localModel) .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build() val labeler = ImageLabeling.getClient(customImageLabelerOptions)
Java
CustomImageLabelerOptions customImageLabelerOptions = new CustomImageLabelerOptions.Builder(localModel) .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build(); ImageLabeler labeler = ImageLabeling.getClient(customImageLabelerOptions);
Nếu có một mô hình được lưu trữ từ xa, bạn sẽ phải kiểm tra để đảm bảo mô hình đó đã được tải xuống trước khi chạy.
Mặc dù bạn chỉ phải xác nhận điều này trước khi chạy trình gắn nhãn, nhưng nếu có cả mô hình được lưu trữ từ xa và mô hình được gói cục bộ, thì bạn nên thực hiện bước kiểm tra này khi khởi tạo trình gắn nhãn hình ảnh: tạo trình gắn nhãn từ mô hình từ xa nếu mô hình đó đã được tải xuống và từ mô hình cục bộ nếu chưa.
Kotlin
val modelFile = File(context.cacheDir, "my_downloaded_model.tflite") val model = if (modelFile.exists()) { // Use the downloaded model if available LocalModel.Builder().setAbsoluteFilePath(modelFile.absolutePath).build() } else { // Fall back to the bundled model LocalModel.Builder().setAssetFilePath("model.tflite").build() } val options = CustomImageLabelerOptions.Builder(model) .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build() val labeler = ImageLabeling.getClient(options)
Java
File modelFile = new File(context.getCacheDir(), "my_downloaded_model.tflite"); LocalModel model; if (modelFile.exists()) { // Use the downloaded model if available model = new LocalModel.Builder().setAbsoluteFilePath(modelFile.getAbsolutePath()).build(); } else { // Fall back to the bundled model model = new LocalModel.Builder().setAssetFilePath("model.tflite").build(); } CustomImageLabelerOptions options = new CustomImageLabelerOptions.Builder(model) .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build(); ImageLabeler labeler = ImageLabeling.getClient(options);
Nếu chỉ có một mô hình được lưu trữ từ xa, bạn nên tắt chức năng liên quan đến mô hình (ví dụ: làm mờ hoặc ẩn một phần giao diện người dùng) cho đến khi xác nhận rằng mô hình đã được tải xuống.
Kotlin
val localFile = File(context.cacheDir, "my_remote_model.tflite") if (localFile.exists()) { initializeLabeler(localFile) } else { showLoadingUI() val storage = Firebase.storage val modelRef = storage.getReferenceFromUrl("gs://YOUR_BUCKET/path/to/model.tflite") modelRef.getFile(localFile) .addOnSuccessListener { hideLoadingUI() initializeLabeler(localFile) } .addOnFailureListener { showErrorUI() } } private fun initializeLabeler(modelFile: File) { val localModel = LocalModel.Builder().setAbsoluteFilePath(modelFile.absolutePath).build() val options = CustomImageLabelerOptions.Builder(localModel).build() val labeler = ImageLabeling.getClient(options) enableMLFeatures(labeler) }
Java
File localFile = new File(context.getCacheDir(), "my_remote_model.tflite"); if (localFile.exists()) { initializeLabeler(localFile); } else { showLoadingUI(); FirebaseStorage storage = FirebaseStorage.getInstance(); StorageReference modelRef = storage.getReferenceFromUrl("gs://YOUR_BUCKET/path/to/model.tflite"); modelRef.getFile(localFile) .addOnSuccessListener(new OnSuccessListener<FileDownloadTask.TaskSnapshot>() { @Override public void onSuccess(FileDownloadTask.TaskSnapshot taskSnapshot) { hideLoadingUI(); initializeLabeler(localFile); } }) .addOnFailureListener(new OnFailureListener() { @Override public void onFailure(@NonNull Exception exception) { showErrorUI(); } }); } private void initializeLabeler(File modelFile) { LocalModel localModel = new LocalModel.Builder().setAbsoluteFilePath(modelFile.getAbsolutePath()).build(); CustomImageLabelerOptions options = new CustomImageLabelerOptions.Builder(localModel).build(); ImageLabeler labeler = ImageLabeling.getClient(options); enableMLFeatures(labeler); }
2. Chuẩn bị hình ảnh đầu vào
Sau đó, đối với mỗi hình ảnh bạn muốn gắn nhãn, hãy tạo một đối tượngInputImage từ hình ảnh đó. Trình gắn nhãn hình ảnh chạy nhanh nhất khi bạn sử dụng Bitmap hoặc, nếu bạn sử dụng camera2 API, thì là media.Image YUV_420_888. Đây là những lựa chọn được đề xuất khi có thể.
Bạn có thể tạo một đối tượng InputImage từ nhiều nguồn, mỗi nguồn được giải thích bên dưới.
Sử dụng media.Image
Để tạo một đối tượng InputImage từ một đối tượng media.Image, chẳng hạn như khi bạn chụp ảnh bằng camera của thiết bị, hãy truyền đối tượng media.Image và độ xoay của hình ảnh đến InputImage.fromMediaImage().
Nếu bạn sử dụng thư viện
CameraX, các lớp OnImageCapturedListener và ImageAnalysis.Analyzer sẽ tính giá trị xoay cho bạn.
Kotlin
private class YourImageAnalyzer : ImageAnalysis.Analyzer { override fun analyze(imageProxy: ImageProxy) { val mediaImage = imageProxy.image if (mediaImage != null) { val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees) // Pass image to an ML Kit Vision API // ... } } }
Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { @Override public void analyze(ImageProxy imageProxy) { Image mediaImage = imageProxy.getImage(); if (mediaImage != null) { InputImage image = InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees()); // Pass image to an ML Kit Vision API // ... } } }
Nếu không dùng thư viện máy ảnh cho biết độ xoay của hình ảnh, bạn có thể tính độ xoay đó từ độ xoay của thiết bị và hướng của cảm biến camera trong thiết bị:
Kotlin
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 0) ORIENTATIONS.append(Surface.ROTATION_90, 90) ORIENTATIONS.append(Surface.ROTATION_180, 180) ORIENTATIONS.append(Surface.ROTATION_270, 270) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // Get the device's sensor orientation. val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360 } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360 } return rotationCompensation }
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 0); ORIENTATIONS.append(Surface.ROTATION_90, 90); ORIENTATIONS.append(Surface.ROTATION_180, 180); ORIENTATIONS.append(Surface.ROTATION_270, 270); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // Get the device's sensor orientation. CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360; } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360; } return rotationCompensation; }
Sau đó, hãy truyền đối tượng media.Image và giá trị độ xoay đến InputImage.fromMediaImage():
Kotlin
val image = InputImage.fromMediaImage(mediaImage, rotation)
Java
InputImage image = InputImage.fromMediaImage(mediaImage, rotation);
Sử dụng URI tệp
Để tạo một đối tượng InputImage từ một URI tệp, hãy truyền ngữ cảnh ứng dụng và URI tệp đến InputImage.fromFilePath(). Điều này hữu ích khi bạn dùng ý định ACTION_GET_CONTENT để nhắc người dùng chọn một hình ảnh trong ứng dụng thư viện của họ.
Kotlin
val image: InputImage try { image = InputImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
Java
InputImage image; try { image = InputImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
Sử dụng ByteBuffer hoặc ByteArray
Để tạo một đối tượng InputImage từ ByteBuffer hoặc ByteArray, trước tiên, hãy tính độ xoay của hình ảnh như mô tả trước đó cho đầu vào media.Image.
Sau đó, hãy tạo đối tượng InputImage bằng vùng đệm hoặc mảng, cùng với chiều cao, chiều rộng, định dạng mã hoá màu và độ xoay của hình ảnh:
Kotlin
val image = InputImage.fromByteBuffer( byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ) // Or: val image = InputImage.fromByteArray( byteArray, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 )
Java
InputImage image = InputImage.fromByteBuffer(byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ); // Or: InputImage image = InputImage.fromByteArray( byteArray, /* image width */480, /* image height */360, rotation, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 );
Sử dụng Bitmap
Để tạo một đối tượng InputImage từ một đối tượng Bitmap, hãy khai báo như sau:
Kotlin
val image = InputImage.fromBitmap(bitmap, 0)
Java
InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);
Hình ảnh được biểu thị bằng một đối tượng Bitmap cùng với độ xoay.
3. Chạy trình gắn nhãn hình ảnh
Để gắn nhãn các đối tượng trong hình ảnh, hãy truyền đối tượng image đến phương thức process() của ImageLabeler.
Kotlin
labeler.process(image) .addOnSuccessListener { labels -> // Task completed successfully // ... } .addOnFailureListener { e -> // Task failed with an exception // ... }
Java
labeler.process(image) .addOnSuccessListener(new OnSuccessListener<List<ImageLabel>>() { @Override public void onSuccess(List<ImageLabel> labels) { // Task completed successfully // ... } }) .addOnFailureListener(new OnFailureListener() { @Override public void onFailure(@NonNull Exception e) { // Task failed with an exception // ... } });
4. Xem thông tin về các thực thể được gắn nhãn
Nếu thao tác gắn nhãn hình ảnh thành công, một danh sách các đối tượngImageLabel sẽ được truyền đến trình nghe thành công. Mỗi đối tượng ImageLabel đại diện cho một đối tượng được gắn nhãn trong hình ảnh. Bạn có thể nhận được nội dung mô tả văn bản của từng nhãn (nếu có trong siêu dữ liệu của tệp mô hình LiteRT), điểm số độ tin cậy và chỉ mục. Ví dụ:
Kotlin
for (label in labels) { val text = label.text val confidence = label.confidence val index = label.index }
Java
for (ImageLabel label : labels) { String text = label.getText(); float confidence = label.getConfidence(); int index = label.getIndex(); }
Mẹo cải thiện hiệu suất theo thời gian thực
Nếu bạn muốn gắn nhãn hình ảnh trong một ứng dụng theo thời gian thực, hãy làm theo các nguyên tắc sau để đạt được tốc độ khung hình tốt nhất:
- Nếu bạn sử dụng API
Camerahoặccamera2, hãy điều chỉnh tốc độ gọi đến trình gắn nhãn hình ảnh. Nếu có một khung video mới trong khi trình gắn nhãn hình ảnh đang chạy, hãy thả khung đó. Hãy xem lớpVisionProcessorBasetrong ứng dụng mẫu bắt đầu nhanh để biết ví dụ. - Nếu bạn sử dụng API
CameraX, hãy đảm bảo rằng chiến lược giảm áp suất được đặt thành giá trị mặc địnhImageAnalysis.STRATEGY_KEEP_ONLY_LATEST. Điều này đảm bảo rằng mỗi lần chỉ có một hình ảnh được gửi để phân tích. Nếu có nhiều hình ảnh được tạo ra khi trình phân tích đang bận, thì những hình ảnh đó sẽ tự động bị loại bỏ và không được đưa vào hàng đợi để phân phối. Sau khi hình ảnh đang được phân tích bị đóng bằng cách gọi ImageProxy.close(), hình ảnh mới nhất tiếp theo sẽ được phân phối. - Nếu bạn dùng kết quả của trình gắn nhãn hình ảnh để phủ đồ hoạ lên hình ảnh đầu vào, trước tiên, hãy lấy kết quả từ Bộ công cụ học máy, sau đó kết xuất hình ảnh và lớp phủ trong một bước. Thao tác này chỉ kết xuất vào bề mặt hiển thị một lần cho mỗi khung đầu vào. Hãy xem các lớp
CameraSourcePreviewvàGraphicOverlaytrong ứng dụng mẫu bắt đầu nhanh để biết ví dụ. - Nếu bạn sử dụng API Camera2, hãy chụp ảnh ở định dạng
ImageFormat.YUV_420_888. Nếu bạn sử dụng API Camera cũ, hãy chụp ảnh ở định dạngImageFormat.NV21.