Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Dengan API pelabelan gambar pada ML Kit, Anda dapat mendeteksi dan mengekstrak informasi
tentang entity dalam gambar di berbagai kategori kategori. Model pelabelan gambar default dapat mengidentifikasi objek, tempat, aktivitas umum, spesies hewan, produk, dan lainnya.
Anda juga dapat menggunakan model klasifikasi gambar kustom untuk menyesuaikan deteksi pada kasus penggunaan tertentu. Lihat Menggunakan model TensorFlow Lite kustom untuk mengetahui informasi selengkapnya.
Kemampuan utama
Pengklasifikasi dasar untuk tujuan umum yang canggih
Mengenali lebih dari 400 kategori yang menjelaskan objek yang paling umum ditemukan dalam
foto.
Sesuaikan dengan kasus penggunaan Anda dengan model kustom
Gunakan model terlatih lainnya dari TensorFlow Hub atau model kustom Anda sendiri yang dilatih
dengan TensorFlow, AutoML Vision Edge, atau pembuat Model TensorFlow Lite.
API tingkat tinggi yang mudah digunakan
Tidak perlu menangani input/output model tingkat rendah, pra-dan
pascapemrosesan gambar, atau membangun pipeline pemrosesan. ML Kit mengekstrak label dari model TensorFlow Lite dan menyediakannya sebagai deskripsi teks.
Perhatikan bahwa API ini ditujukan untuk model klasifikasi gambar yang mendeskripsikan
gambar penuh. Untuk mengklasifikasikan satu atau beberapa objek dalam gambar, seperti sepatu atau
perabot, Deteksi & Pelacakan Objek
API mungkin lebih cocok.
Model klasifikasi gambar yang didukung
Image Labeling API mendukung berbagai model klasifikasi gambar:
Model klasifikasi gambar yang didukung
Model dasar
Secara default, API tersebut menggunakan model pelabelan gambar tujuan umum yang andal dan mengenali lebih dari 400 entity yang mencakup konsep yang paling umum ditemukan dalam foto.
Model TensorFlow Lite kustom
Untuk menargetkan konsep khusus aplikasi, API ini menerima model klasifikasi gambar kustom dari berbagai sumber. Ini dapat berupa model terlatih yang didownload dari TensorFlow Hub atau model Anda sendiri yang dilatih dengan AutoML Vision Edge, TensorFlow Lite Model Maker, atau TensorFlow itu sendiri. Model dapat dipaketkan dengan aplikasi Anda atau dihosting dengan Firebase Machine Learning dan didownload saat runtime.
Menggunakan model dasar
Model dasar ML Kit menampilkan daftar entity yang mengidentifikasi orang, objek, tempat, aktivitas, dan sebagainya. Setiap entity memiliki skor yang menunjukkan keyakinan model ML atas relevansinya. Berbekal
informasi ini, Anda dapat melakukan tugas-tugas seperti pembuatan metadata otomatis dan
moderasi konten. Model default yang disediakan dengan ML Kit mengenali lebih dari 400 entity yang berbeda.
Model dasar dalam API pelabelan gambar mendukung 400+ label, seperti contoh berikut:
Kategori
Label contoh
Orang
Crowd Selfie Smile
Aktivitas
Dancing Eating Surfing
Berbagai hal
Car Piano Receipt
Hewan
Bird Cat Dog
Tanaman
Flower Fruit Vegetable
Tempat
Beach Lake Mountain
Hasil contoh
Berikut adalah contoh entitas yang dikenali dalam foto yang menyertainya.
Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Label 0
Teks
Stadion
Keyakinan
0,9205354
Label 1
Teks
Sports
Keyakinan
0,7531109
Label 2
Teks
Event
Keyakinan
0,66905296
Label 3
Teks
Rekreasi
Keyakinan
0,59904146
Label 4
Teks
Sepak Bola
Keyakinan
0,56384534
Label 5
Teks
Bersih
Keyakinan
0,54679185
Label 6
Teks
Tanaman
Keyakinan
0,524364
Menggunakan model TensorFlow Lite kustom
Model pelabelan gambar dasar ML Kit dibangun untuk penggunaan umum. Model ini
dilatih untuk mengenali 400 kategori yang mendeskripsikan objek yang paling umum
ditemukan dalam foto. Aplikasi Anda mungkin memerlukan model klasifikasi gambar khusus
yang mengenali jumlah kategori yang lebih sedikit secara lebih mendetail, seperti model
yang membedakan antara spesies bunga atau jenis makanan.
API ini memungkinkan Anda menyesuaikan kasus penggunaan tertentu dengan mendukung model klasifikasi gambar kustom dari berbagai sumber. Lihat Model kustom dengan ML Kit untuk mempelajari lebih lanjut. Model kustom dapat dipaketkan dengan aplikasi Anda atau didownload secara dinamis dari cloud menggunakan layanan deployment Model Firebase Machine Learning.
Jika diperlukan, Pelabelan Gambar menggunakan penskalaan dan peregangan gambar bilinear untuk menyesuaikan
ukuran dan rasio aspek gambar input agar sesuai dengan persyaratan
model yang mendasarinya.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-09-04 UTC."],[[["\u003cp\u003eML Kit's image labeling APIs can detect and extract information about entities in an image, including objects, places, activities, and more.\u003c/p\u003e\n"],["\u003cp\u003eYou can leverage the powerful base model to identify over 400 common entities or use custom models tailored to specific use cases.\u003c/p\u003e\n"],["\u003cp\u003eML Kit simplifies the process with high-level APIs that abstract away low-level model complexities, making integration easier.\u003c/p\u003e\n"],["\u003cp\u003eEasily incorporate custom TensorFlow Lite models, whether bundled with your app or dynamically downloaded, to enable specialized image classification.\u003c/p\u003e\n"],["\u003cp\u003eImage Labeling automatically adjusts the input image size and aspect ratio to fit the model's requirements.\u003c/p\u003e\n"]]],[],null,["With ML Kit's image labeling APIs you can detect and extract information\nabout entities in an image across a broad group of categories. The default\nimage labeling model can identify general objects, places, activities, animal\nspecies, products, and more.\n\nYou can also use a custom image classification model to tailor detection\nto a specific use case. See [Using a custom TensorFlow Lite model](#custom-tflite)\nfor more information.\n\nKey capabilities\n\n- **A powerful general-purpose base classifier** Recognizes more than 400 categories that describe the most commonly found objects in photos.\n- **Tailor to your use case with custom models** Use other pre-trained models from TensorFlow Hub or your own custom model trained with TensorFlow, AutoML Vision Edge or TensorFlow Lite Model maker.\n- **Easy-to-use high-level APIs** No need to deal with low-level model input/output, image pre- and post-processing, or building a processing pipeline. ML Kit extracts the labels from the TensorFlow Lite model and provides them as a text description.\n\nNote that this API is intended for image classification models that describe the\nfull image. For classifying one or more objects in an image, such as shoes or\npieces of furniture, the\n[Object Detection \\& Tracking](/ml-kit/vision/object-detection)\nAPI may be a better fit.\n\nSupported image classification models\n\nThe Image Labeling APIs support different image classification models:\n\n| Supported image classification models ||\n|-----------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| **Base model** | By default the API uses a powerful general-purpose image labeling model that recognizes more than 400 entities that cover the most commonly-found concepts in photos. |\n| **Custom TensorFlow Lite models** | To target application-specific concepts, the API accepts custom image classification models from a wide range of sources. These can be pre-trained models downloaded from TensorFlow Hub or your own models trained with AutoML Vision Edge, TensorFlow Lite Model Maker or TensorFlow itself. Models can be bundled with your app or hosted with Firebase Machine Learning and downloaded at run-time. |\n\nUsing the base model\n\nML Kit's base model returns a list of entities that identify people,\nthings, places, activities, and so on. Each entity comes with a score that\nindicates the confidence the ML model has in its relevance. With this\ninformation, you can perform tasks such as automatic metadata generation and\ncontent moderation. The default model provided with ML Kit recognizes more than\n[400 different entities](/ml-kit/vision/image-labeling/label-map).\n\n[iOS](/ml-kit/vision/image-labeling/ios)\n[Android](/ml-kit/vision/image-labeling/android)\n\nExample labels\n\nThe base model in the image labeling API supports 400+ labels, such as the\nfollowing examples:\n\n| Category | Example labels |\n|------------|------------------------------|\n| People | `Crowd` `Selfie` `Smile` |\n| Activities | `Dancing` `Eating` `Surfing` |\n| Things | `Car` `Piano` `Receipt` |\n| Animals | `Bird` `Cat` `Dog` |\n| Plants | `Flower` `Fruit` `Vegetable` |\n| Places | `Beach` `Lake` `Mountain` |\n\nExample results\n\nHere is an example of the entities that were recognized in the accompanying photo.\nPhoto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0\n\n| Label 0 ||\n|----------------|------------|\n| **Text** | Stadium |\n| **Confidence** | 0.9205354 |\n| **Text** | Sports |\n| **Confidence** | 0.7531109 |\n| **Text** | Event |\n| **Confidence** | 0.66905296 |\n| **Text** | Leisure |\n| **Confidence** | 0.59904146 |\n| **Text** | Soccer |\n| **Confidence** | 0.56384534 |\n| **Text** | Net |\n| **Confidence** | 0.54679185 |\n| **Text** | Plant |\n| **Confidence** | 0.524364 |\n\nUsing a custom TensorFlow Lite model\n\nML Kit's base image labeling model is built for general-purpose use. It's\ntrained to recognize 400 categories that describe the most commonly-found\nobjects in photos. Your app might need a specialized image classification model\nthat recognizes a narrower number of categories in more detail, such as a model\nthat distinguishes between species of flowers or types of food.\n\nThis API lets you tailor to a particular use case by supporting custom image\nclassification models from a wide range of sources. Please refer to [Custom models with ML Kit](/ml-kit/custom-models)\nto learn more. Custom models can be bundled with your app or dynamically\ndownloaded from the cloud using Firebase Machine Learning's Model deployment\nservice.\n\n[iOS](/ml-kit/vision/image-labeling/custom-models/ios)\n[Android](/ml-kit/vision/image-labeling/custom-models/android)\n\nInput image preprocessing\n\nIf needed, Image Labeling uses bilinear image scaling and stretching to adjust\nthe input image size and aspect ratio so that they fit the requirements of the\nunderlying model."]]