Pelabelan gambar

Dengan API pelabelan gambar ML Kit, Anda dapat mendeteksi dan mengekstrak informasi tentang entity dalam gambar di berbagai kategori yang luas. Model pelabelan gambar default dapat mengidentifikasi objek umum, tempat, aktivitas, spesies hewan, produk, dan lainnya.

Anda juga dapat menggunakan model klasifikasi gambar kustom untuk menyesuaikan deteksi dengan kasus penggunaan tertentu. Lihat Menggunakan model LiteRT kustom untuk mengetahui informasi selengkapnya.

Kemampuan utama

  • Pengklasifikasi dasar tujuan umum yang andal Mengenali lebih dari 400 kategori yang mendeskripsikan objek yang paling umum ditemukan dalam foto.
  • Sesuaikan dengan kasus penggunaan Anda menggunakan model kustom Gunakan model terlatih lainnya dari TensorFlow Hub atau model kustom Anda sendiri yang dilatih dengan TensorFlow, AutoML, atau LiteRT.
  • API tingkat tinggi yang mudah digunakan Tidak perlu menangani input/output model tingkat rendah, pra- dan pasca-pemrosesan gambar, atau membuat pipeline pemrosesan. ML Kit mengekstrak label dari model LiteRT dan menyediakannya sebagai deskripsi teks.

Perhatikan bahwa API ini ditujukan untuk model klasifikasi gambar yang mendeskripsikan gambar lengkap. Untuk mengklasifikasikan satu atau beberapa objek dalam gambar, seperti sepatu atau perabot, Object Detection & Tracking API mungkin lebih cocok.

Model klasifikasi gambar yang didukung

Image Labeling API mendukung berbagai model klasifikasi gambar:

Model klasifikasi gambar yang didukung
Model dasar Secara default, API menggunakan model pelabelan gambar tujuan umum yang andal yang mengenali lebih dari 400 entity yang mencakup konsep yang paling umum ditemukan dalam foto.
Model LiteRT kustom Untuk menargetkan konsep khusus aplikasi, API menerima model klasifikasi gambar kustom dari berbagai sumber. Model ini dapat berupa model terlatih didownload dari TensorFlow Hub atau model Anda sendiri yang dilatih dengan AutoML, LiteRT, atau TensorFlow itu sendiri. Model dapat di paketkan dengan aplikasi Anda atau dihosting dengan Cloud Storage dan didownload saat runtime.

Menggunakan model dasar

Model dasar ML Kit menampilkan daftar entity yang mengidentifikasi orang, benda, tempat, aktivitas, dan sebagainya. Setiap entity dilengkapi dengan skor yang menunjukkan keyakinan model ML atas relevansinya. Dengan informasi ini, Anda dapat melakukan tugas-tugas seperti pembuatan metadata otomatis dan moderasi konten. Model default yang disediakan dengan ML Kit mengenali lebih dari 400 entity yang berbeda.

iOS Android

Contoh label

Model dasar dalam API pelabelan gambar mendukung 400+ label, seperti contoh berikut:

KategoriContoh label
Orang Crowd
Selfie
Smile
Aktivitas Dancing
Eating
Surfing
Objek Car
Piano
Receipt
Hewan Bird
Cat
Dog
Tanaman Flower
Fruit
Vegetable
Tempat Beach
Lake
Mountain

Hasil contoh

Berikut adalah contoh entity yang dikenali dalam foto yang disertakan.

Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Label 0
Teks Stadion
Tingkat keyakinan 0.9205354
Label 1
Teks Olahraga
Tingkat keyakinan 0.7531109
Label 2
Teks Acara
Tingkat keyakinan 0.66905296
Label 3
Teks Rekreasi
Tingkat keyakinan 0.59904146
Label 4
Teks Sepak Bola
Tingkat keyakinan 0.56384534
Label 5
Teks Bersih
Tingkat keyakinan 0.54679185
Label 6
Teks Tanaman
Tingkat keyakinan 0.524364

Menggunakan model LiteRT kustom

Model pelabelan gambar dasar ML Kit dibuat untuk tujuan umum. Model ini dilatih untuk mengenali 400 kategori yang mendeskripsikan objek yang paling umum ditemukan dalam foto. Aplikasi Anda mungkin memerlukan model klasifikasi gambar khusus yang mengenali jumlah kategori yang lebih sempit secara lebih mendetail, seperti model yang membedakan antara spesies bunga atau jenis makanan.

API ini memungkinkan Anda menyesuaikan dengan kasus penggunaan tertentu dengan mendukung model klasifikasi gambar kustom dari berbagai sumber. Lihat Model kustom dengan ML Kit untuk mempelajari lebih lanjut. Model kustom dapat dipaketkan dengan aplikasi Anda atau didownload secara dinamis dari Cloud Storage.

iOS Android

Pra-pemrosesan gambar input

Jika diperlukan, Pelabelan Gambar menggunakan penskalaan dan peregangan gambar bilinear untuk menyesuaikan ukuran dan rasio aspek gambar input sehingga sesuai dengan persyaratan model yang mendasarinya.