Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Với các API gắn nhãn hình ảnh của Bộ công cụ học máy, bạn có thể phát hiện và trích xuất thông tin về các thực thể trong một hình ảnh trên một nhóm danh mục lớn. Mô hình gắn nhãn hình ảnh mặc định có thể xác định các đối tượng, địa điểm, hoạt động, loài động vật, sản phẩm chung và các thông tin khác.
Bạn cũng có thể sử dụng mô hình phân loại hình ảnh tuỳ chỉnh để điều chỉnh khả năng phát hiện cho một trường hợp sử dụng cụ thể. Hãy xem bài viết Sử dụng mô hình TensorFlow Lite tuỳ chỉnh để biết thêm thông tin.
Các khả năng chính
Một thuật toán phân loại cơ sở mạnh mẽ đa năng Nhận biết hơn 400 danh mục mô tả các đối tượng thường gặp nhất trong ảnh.
Điều chỉnh cho phù hợp với trường hợp sử dụng của bạn với mô hình tuỳ chỉnh
Sử dụng các mô hình luyện sẵn khác từ TensorFlow Hub hoặc mô hình tuỳ chỉnh của riêng bạn được huấn luyện
bằng TensorFlow, AutoML Vision Edge hoặc trình tạo mô hình TensorFlow Lite.
API cấp cao dễ sử dụng Không cần phải xử lý đầu vào/đầu ra của mô hình cấp thấp, xử lý trước và sau hình ảnh hay xây dựng quy trình xử lý. Bộ công cụ học máy trích xuất các nhãn từ mô hình TensorFlow Lite và cung cấp các nhãn đó dưới dạng nội dung mô tả văn bản.
Xin lưu ý rằng API này dành cho các mô hình phân loại hình ảnh mô tả hình ảnh đầy đủ. Để phân loại một hoặc nhiều đối tượng trong một hình ảnh, chẳng hạn như giày dép hoặc đồ nội thất, API Phát hiện và theo dõi đối tượng có thể phù hợp hơn.
Các mô hình phân loại hình ảnh được hỗ trợ
Image Labeling API hỗ trợ nhiều mô hình phân loại hình ảnh:
Các mô hình phân loại hình ảnh được hỗ trợ
Mẫu cơ sở
Theo mặc định, API này sử dụng một mô hình gắn nhãn hình ảnh mạnh mẽ đa năng, giúp nhận dạng hơn 400 thực thể có chứa các khái niệm thường gặp nhất trong ảnh.
Mô hình TensorFlow Lite tuỳ chỉnh
Để nhắm mục tiêu đến các khái niệm dành riêng cho ứng dụng, API chấp nhận các mô hình phân loại hình ảnh tuỳ chỉnh từ nhiều nguồn. Các mô hình này có thể là mô hình luyện sẵn, được tải xuống từ TensorFlow Hub hoặc là mô hình của riêng bạn được huấn luyện bằng AutoML Vision Edge, Trình tạo mô hình TensorFlow Lite hoặc chính TensorFlow. Bạn có thể đóng gói các mô hình với ứng dụng hoặc lưu trữ bằng công nghệ Học máy của Firebase
và tải xuống trong thời gian chạy.
Sử dụng mô hình cơ sở
Mô hình cơ sở của Bộ công cụ học máy trả về danh sách các thực thể xác định người, sự vật, địa điểm, hoạt động, v.v. Mỗi thực thể sẽ có một điểm số cho biết mức độ tin cậy của mô hình học máy về mức độ liên quan của nó. Với thông tin này, bạn có thể thực hiện các công việc như tự động tạo siêu dữ liệu và kiểm duyệt nội dung. Mô hình mặc định đi kèm với Bộ công cụ học máy nhận dạng hơn 400 thực thể.
Mô hình cơ sở trong API gắn nhãn hình ảnh hỗ trợ hơn 400 nhãn, chẳng hạn như các ví dụ sau:
Danh mục
Nhãn mẫu
Mọi người
Crowd Selfie Smile
Hoạt động
Dancing Eating Surfing
Sự vật
Car Piano Receipt
Động vật
Bird Cat Dog
Thực vật
Flower Fruit Vegetable
Địa điểm
Beach Lake Mountain
Kết quả mẫu
Dưới đây là ví dụ về các thực thể đã được nhận dạng trong ảnh đi kèm.
Ảnh: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Nhãn 0
Văn bản
Sân vận động
Mức độ tin cậy
0,9205354
Nhãn 1
Văn bản
Thể thao
Mức độ tin cậy
0,7531109
Nhãn 2
Văn bản
Sự kiện
Mức độ tin cậy
0,66905296
Nhãn 3
Văn bản
Giải trí
Mức độ tin cậy
0,59904146
Nhãn 4
Văn bản
Bóng đá
Mức độ tin cậy
0,56384534
Nhãn 5
Văn bản
Thực
Mức độ tin cậy
0,54679185
Nhãn 6
Văn bản
Thực vật
Mức độ tin cậy
0,524364
Sử dụng mô hình TensorFlow Lite tuỳ chỉnh
Mô hình gắn nhãn hình ảnh cơ sở của Bộ công cụ học máy được thiết kế để sử dụng cho nhiều mục đích. API này được huấn luyện để nhận ra 400 danh mục mô tả các đối tượng thường thấy nhất trong ảnh. Ứng dụng của bạn có thể cần một mô hình phân loại hình ảnh chuyên biệt giúp nhận dạng một số lượng danh mục hẹp hơn một cách chi tiết, chẳng hạn như một mô hình phân biệt giữa các loài hoa hoặc loại thực phẩm.
API này cho phép bạn điều chỉnh cho phù hợp với một trường hợp sử dụng cụ thể bằng cách hỗ trợ các mô hình phân loại hình ảnh tuỳ chỉnh từ nhiều nguồn. Vui lòng tham khảo bài viết Mô hình tuỳ chỉnh đi kèm Bộ công cụ học máy để tìm hiểu thêm. Bạn có thể đóng gói các mô hình tuỳ chỉnh với ứng dụng của mình hoặc tự động tải các mô hình đó xuống từ đám mây bằng cách sử dụng dịch vụ triển khai mô hình của Công nghệ học máy Firebase.
Nếu cần, tính năng Gắn nhãn hình ảnh sẽ sử dụng tỷ lệ và kéo giãn hình ảnh song tuyến tính để điều chỉnh kích thước hình ảnh đầu vào và tỷ lệ khung hình cho phù hợp với yêu cầu của mô hình cơ sở.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2025-09-04 UTC."],[[["\u003cp\u003eML Kit's image labeling APIs can detect and extract information about entities in an image, including objects, places, activities, and more.\u003c/p\u003e\n"],["\u003cp\u003eYou can leverage the powerful base model to identify over 400 common entities or use custom models tailored to specific use cases.\u003c/p\u003e\n"],["\u003cp\u003eML Kit simplifies the process with high-level APIs that abstract away low-level model complexities, making integration easier.\u003c/p\u003e\n"],["\u003cp\u003eEasily incorporate custom TensorFlow Lite models, whether bundled with your app or dynamically downloaded, to enable specialized image classification.\u003c/p\u003e\n"],["\u003cp\u003eImage Labeling automatically adjusts the input image size and aspect ratio to fit the model's requirements.\u003c/p\u003e\n"]]],[],null,["With ML Kit's image labeling APIs you can detect and extract information\nabout entities in an image across a broad group of categories. The default\nimage labeling model can identify general objects, places, activities, animal\nspecies, products, and more.\n\nYou can also use a custom image classification model to tailor detection\nto a specific use case. See [Using a custom TensorFlow Lite model](#custom-tflite)\nfor more information.\n\nKey capabilities\n\n- **A powerful general-purpose base classifier** Recognizes more than 400 categories that describe the most commonly found objects in photos.\n- **Tailor to your use case with custom models** Use other pre-trained models from TensorFlow Hub or your own custom model trained with TensorFlow, AutoML Vision Edge or TensorFlow Lite Model maker.\n- **Easy-to-use high-level APIs** No need to deal with low-level model input/output, image pre- and post-processing, or building a processing pipeline. ML Kit extracts the labels from the TensorFlow Lite model and provides them as a text description.\n\nNote that this API is intended for image classification models that describe the\nfull image. For classifying one or more objects in an image, such as shoes or\npieces of furniture, the\n[Object Detection \\& Tracking](/ml-kit/vision/object-detection)\nAPI may be a better fit.\n\nSupported image classification models\n\nThe Image Labeling APIs support different image classification models:\n\n| Supported image classification models ||\n|-----------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| **Base model** | By default the API uses a powerful general-purpose image labeling model that recognizes more than 400 entities that cover the most commonly-found concepts in photos. |\n| **Custom TensorFlow Lite models** | To target application-specific concepts, the API accepts custom image classification models from a wide range of sources. These can be pre-trained models downloaded from TensorFlow Hub or your own models trained with AutoML Vision Edge, TensorFlow Lite Model Maker or TensorFlow itself. Models can be bundled with your app or hosted with Firebase Machine Learning and downloaded at run-time. |\n\nUsing the base model\n\nML Kit's base model returns a list of entities that identify people,\nthings, places, activities, and so on. Each entity comes with a score that\nindicates the confidence the ML model has in its relevance. With this\ninformation, you can perform tasks such as automatic metadata generation and\ncontent moderation. The default model provided with ML Kit recognizes more than\n[400 different entities](/ml-kit/vision/image-labeling/label-map).\n\n[iOS](/ml-kit/vision/image-labeling/ios)\n[Android](/ml-kit/vision/image-labeling/android)\n\nExample labels\n\nThe base model in the image labeling API supports 400+ labels, such as the\nfollowing examples:\n\n| Category | Example labels |\n|------------|------------------------------|\n| People | `Crowd` `Selfie` `Smile` |\n| Activities | `Dancing` `Eating` `Surfing` |\n| Things | `Car` `Piano` `Receipt` |\n| Animals | `Bird` `Cat` `Dog` |\n| Plants | `Flower` `Fruit` `Vegetable` |\n| Places | `Beach` `Lake` `Mountain` |\n\nExample results\n\nHere is an example of the entities that were recognized in the accompanying photo.\nPhoto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0\n\n| Label 0 ||\n|----------------|------------|\n| **Text** | Stadium |\n| **Confidence** | 0.9205354 |\n| **Text** | Sports |\n| **Confidence** | 0.7531109 |\n| **Text** | Event |\n| **Confidence** | 0.66905296 |\n| **Text** | Leisure |\n| **Confidence** | 0.59904146 |\n| **Text** | Soccer |\n| **Confidence** | 0.56384534 |\n| **Text** | Net |\n| **Confidence** | 0.54679185 |\n| **Text** | Plant |\n| **Confidence** | 0.524364 |\n\nUsing a custom TensorFlow Lite model\n\nML Kit's base image labeling model is built for general-purpose use. It's\ntrained to recognize 400 categories that describe the most commonly-found\nobjects in photos. Your app might need a specialized image classification model\nthat recognizes a narrower number of categories in more detail, such as a model\nthat distinguishes between species of flowers or types of food.\n\nThis API lets you tailor to a particular use case by supporting custom image\nclassification models from a wide range of sources. Please refer to [Custom models with ML Kit](/ml-kit/custom-models)\nto learn more. Custom models can be bundled with your app or dynamically\ndownloaded from the cloud using Firebase Machine Learning's Model deployment\nservice.\n\n[iOS](/ml-kit/vision/image-labeling/custom-models/ios)\n[Android](/ml-kit/vision/image-labeling/custom-models/android)\n\nInput image preprocessing\n\nIf needed, Image Labeling uses bilinear image scaling and stretching to adjust\nthe input image size and aspect ratio so that they fit the requirements of the\nunderlying model."]]