
Dengan API pelabelan gambar ML Kit, Anda dapat mendeteksi dan mengekstrak informasi tentang entity dalam gambar di berbagai kategori yang luas. Model pelabelan gambar default dapat mengidentifikasi objek umum, tempat, aktivitas, spesies hewan, produk, dan lainnya.
Anda juga dapat menggunakan model klasifikasi gambar kustom untuk menyesuaikan deteksi dengan kasus penggunaan tertentu. Lihat Menggunakan model LiteRT kustom untuk mengetahui informasi selengkapnya.
Kemampuan utama
- Pengklasifikasi dasar tujuan umum yang andal Mengenali lebih dari 400 kategori yang mendeskripsikan objek yang paling umum ditemukan dalam foto.
- Sesuaikan dengan kasus penggunaan Anda menggunakan model kustom Gunakan model terlatih lainnya dari TensorFlow Hub atau model kustom Anda sendiri yang dilatih dengan TensorFlow, AutoML, atau LiteRT.
- API tingkat tinggi yang mudah digunakan Tidak perlu menangani input/output model tingkat rendah, pra- dan pasca-pemrosesan gambar, atau membuat pipeline pemrosesan. ML Kit mengekstrak label dari model LiteRT dan menyediakannya sebagai deskripsi teks.
Perhatikan bahwa API ini ditujukan untuk model klasifikasi gambar yang mendeskripsikan gambar lengkap. Untuk mengklasifikasikan satu atau beberapa objek dalam gambar, seperti sepatu atau perabot, Object Detection & Tracking API mungkin lebih cocok.
Model klasifikasi gambar yang didukung
Image Labeling API mendukung berbagai model klasifikasi gambar:
| Model klasifikasi gambar yang didukung | |
|---|---|
| Model dasar | Secara default, API menggunakan model pelabelan gambar tujuan umum yang andal yang mengenali lebih dari 400 entity yang mencakup konsep yang paling umum ditemukan dalam foto. |
| Model LiteRT kustom | Untuk menargetkan konsep khusus aplikasi, API menerima model klasifikasi gambar kustom dari berbagai sumber. Model ini dapat berupa model terlatih didownload dari TensorFlow Hub atau model Anda sendiri yang dilatih dengan AutoML, LiteRT, atau TensorFlow itu sendiri. Model dapat di paketkan dengan aplikasi Anda atau dihosting dengan Cloud Storage dan didownload saat runtime. |
Menggunakan model dasar
Model dasar ML Kit menampilkan daftar entity yang mengidentifikasi orang, benda, tempat, aktivitas, dan sebagainya. Setiap entity dilengkapi dengan skor yang menunjukkan keyakinan model ML atas relevansinya. Dengan informasi ini, Anda dapat melakukan tugas-tugas seperti pembuatan metadata otomatis dan moderasi konten. Model default yang disediakan dengan ML Kit mengenali lebih dari 400 entity yang berbeda.
Contoh label
Model dasar dalam API pelabelan gambar mendukung 400+ label, seperti contoh berikut:
| Kategori | Contoh label |
|---|---|
| Orang | CrowdSelfieSmile |
| Aktivitas | DancingEatingSurfing |
| Objek | CarPianoReceipt |
| Hewan | BirdCatDog |
| Tanaman | FlowerFruitVegetable |
| Tempat | BeachLakeMountain |
Hasil contoh
Berikut adalah contoh entity yang dikenali dalam foto yang disertakan.
| Label 0 | |
|---|---|
| Teks | Stadion |
| Tingkat keyakinan | 0.9205354 |
| Label 1 | |
| Teks | Olahraga |
| Tingkat keyakinan | 0.7531109 |
| Label 2 | |
| Teks | Acara |
| Tingkat keyakinan | 0.66905296 |
| Label 3 | |
| Teks | Rekreasi |
| Tingkat keyakinan | 0.59904146 |
| Label 4 | |
| Teks | Sepak Bola |
| Tingkat keyakinan | 0.56384534 |
| Label 5 | |
| Teks | Bersih |
| Tingkat keyakinan | 0.54679185 |
| Label 6 | |
| Teks | Tanaman |
| Tingkat keyakinan | 0.524364 |
Menggunakan model LiteRT kustom
Model pelabelan gambar dasar ML Kit dibuat untuk tujuan umum. Model ini dilatih untuk mengenali 400 kategori yang mendeskripsikan objek yang paling umum ditemukan dalam foto. Aplikasi Anda mungkin memerlukan model klasifikasi gambar khusus yang mengenali jumlah kategori yang lebih sempit secara lebih mendetail, seperti model yang membedakan antara spesies bunga atau jenis makanan.
API ini memungkinkan Anda menyesuaikan dengan kasus penggunaan tertentu dengan mendukung model klasifikasi gambar kustom dari berbagai sumber. Lihat Model kustom dengan ML Kit untuk mempelajari lebih lanjut. Model kustom dapat dipaketkan dengan aplikasi Anda atau didownload secara dinamis dari Cloud Storage.
Pra-pemrosesan gambar input
Jika diperlukan, Pelabelan Gambar menggunakan penskalaan dan peregangan gambar bilinear untuk menyesuaikan ukuran dan rasio aspek gambar input sehingga sesuai dengan persyaratan model yang mendasarinya.