
ML Kit'in görüntü etiketleme API'leriyle, geniş bir kategori grubundaki bir görüntüdeki öğelerle ilgili bilgileri algılayıp ayıklayabilirsiniz. Varsayılan görüntü etiketleme modeli; genel nesneleri, yerleri, etkinlikleri, hayvan türlerini, ürünleri ve daha fazlasını tanımlayabilir.
Algılamayı belirli bir kullanım alanına göre uyarlamak için özel bir görüntü sınıflandırma modeli de kullanabilirsiniz. Daha fazla bilgi için Özel LiteRT modeli kullanma başlıklı makaleyi inceleyin.
Temel özellikler
- Güçlü bir genel amaçlı temel sınıflandırıcı Fotoğraflarda en sık rastlanan nesneleri açıklayan 400'den fazla kategoriyi tanır.
- Özel modellerle kullanım alanınıza göre uyarlama TensorFlow Hub'daki diğer önceden eğitilmiş modelleri veya TensorFlow, AutoML ya da LiteRT ile eğitilmiş kendi özel modelinizi kullanın.
- Kullanımı kolay üst düzey API'ler Düşük düzeyli model girişi/çıkışı, resim ön işleme ve son işleme ya da işleme ardışık düzeni oluşturma ile uğraşmanıza gerek yoktur. ML Kiti, LiteRT modelinden etiketleri ayıklar ve bunları metin açıklaması olarak sağlar.
Bu API'nin, resmin tamamını açıklayan görüntü sınıflandırma modelleri için tasarlandığını unutmayın. Bir resimdeki bir veya daha fazla nesneyi (ör. ayakkabılar veya mobilyalar) sınıflandırmak için Nesne Algılama ve İzleme API'si daha uygun olabilir.
Desteklenen görüntü sınıflandırma modelleri
Görüntü Etiketleme API'leri farklı görüntü sınıflandırma modellerini destekler:
| Desteklenen görüntü sınıflandırma modelleri | |
|---|---|
| Temel model | API, varsayılan olarak fotoğraflarda en sık rastlanılan kavramları kapsayan 400'den fazla öğeyi tanıyan güçlü bir genel amaçlı görüntü etiketleme modeli kullanır. |
| Özel LiteRT modelleri | API, uygulamaya özgü kavramları hedeflemek için çok çeşitli kaynaklardan gelen özel görüntü sınıflandırma modellerini kabul eder. Bunlar, TensorFlow Hub'dan indirilen önceden eğitilmiş modeller veya AutoML, LiteRT ya da TensorFlow ile eğitilmiş kendi modelleriniz olabilir. Modeller, uygulamanızla birlikte paketlenebilir veya Cloud Storage'da barındırılıp çalışma zamanında indirilebilir. |
Temel modeli kullanma
ML Kit'in temel modeli, kişileri, nesneleri, yerleri, etkinlikleri vb. tanımlayan bir varlık listesi döndürür. Her varlık, makine öğrenimi modelinin alaka düzeyine olan güvenini gösteren bir puanla birlikte gelir. Bu bilgilerle otomatik meta veri oluşturma ve içerik denetleme gibi görevleri gerçekleştirebilirsiniz. ML Kit ile birlikte sunulan varsayılan model, 400'den fazla farklı varlığı tanır.
Örnek etiketler
Görüntü etiketleme API'sindeki temel model, aşağıdakiler gibi 400'den fazla etiketi destekler:
| Kategori | Örnek etiketler |
|---|---|
| Kişiler | CrowdSelfieSmile |
| Etkinlikler | DancingEatingSurfing |
| Nesneler | CarPianoReceipt |
| Hayvanlar | BirdCatDog |
| Bitkiler | FlowerFruitVegetable |
| Yerler | BeachLakeMountain |
Örnek sonuçlar
Ekteki fotoğrafta tanınan öğelere bir örnek verilmiştir.
| Etiket 0 | |
|---|---|
| Metin | Stadyum |
| Güven | 0,9205354 |
| 1. etiket | |
| Metin | Spor |
| Güven | 0,7531109 |
| Etiket 2 | |
| Metin | Etkinlik |
| Güven | 0,66905296 |
| Etiket 3 | |
| Metin | Boş zaman |
| Güven | 0,59904146 |
| Etiket 4 | |
| Metin | Futbol |
| Güven | 0.56384534 |
| Etiket 5 | |
| Metin | Net |
| Güven | 0,54679185 |
| Etiket 6 | |
| Metin | Bitki |
| Güven | 0,524364 |
Özel bir LiteRT modeli kullanma
ML Kit'in temel görüntü etiketleme modeli, genel amaçlı kullanım için tasarlanmıştır. Fotoğraflarda en sık rastlanan nesneleri tanımlayan 400 kategoriyi tanıyacak şekilde eğitilmiştir. Uygulamanız, daha az sayıda kategoriyi daha ayrıntılı olarak tanıyan özel bir görüntü sınıflandırma modeline ihtiyaç duyabilir. Örneğin, çiçek türleri veya yemek çeşitleri arasında ayrım yapan bir model.
Bu API, çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre uyarlama yapmanıza olanak tanır. Daha fazla bilgi için ML Kit ile özel modeller başlıklı makaleyi inceleyin. Özel modeller, uygulamanızla birlikte paketlenebilir veya Cloud Storage'dan dinamik olarak indirilebilir.
Giriş görüntüsünün ön işlenmesi
Gerekirse Görüntü Etiketleme, giriş görüntüsü boyutunu ve en-boy oranını temel modelin koşullarına uyacak şekilde ayarlamak için çift doğrusal görüntü ölçeklendirme ve uzatma yöntemlerini kullanır.