
ML Kit'in cihaz üzerinde nesne tespit etme ve izleme API'si ile bir resimdeki veya canlı kamera feed'indeki nesneleri tespit edip izleyebilirsiniz.
İsteğe bağlı olarak, algılanan nesneleri sınıflandırabilirsiniz. Bunun için API'ye yerleştirilmiş kaba sınıflandırıcıyı veya kendi özel görüntü sınıflandırma modelinizi kullanabilirsiniz. Daha fazla bilgi için Özel bir LiteRT modeli kullanma başlıklı makaleyi inceleyin.
Nesne tespit etme ve izleme cihazda gerçekleştiğinden, görsel arama ardışık düzeninin ön ucu olarak iyi çalışır. Nesneleri algılayıp filtreledikten sonra Cloud Vision Product Search gibi bir bulut arka ucuna iletebilirsiniz.
Temel özellikler
- Hızlı nesne tespit etme ve izleme Nesneleri tespit edin ve görüntüdeki konumlarını öğrenin. Nesneleri ardışık görüntü karelerinde izleyin.
- Optimize edilmiş cihaz üzerinde model Nesne tespit etme ve izleme modeli, mobil cihazlar için optimize edilmiştir ve daha düşük seviyeli cihazlarda bile gerçek zamanlı uygulamalarda kullanılmak üzere tasarlanmıştır.
- Öne çıkan nesne tespit etme Bir resimdeki en öne çıkan nesneyi otomatik olarak belirleyin.
- Kaba sınıflandırma Nesneleri geniş kategorilere ayırın. Bu kategorileri, ilgilenmediğiniz nesneleri filtrelemek için kullanabilirsiniz. Aşağıdaki kategoriler desteklenir: ev ürünleri, moda ürünleri, gıda, bitkiler ve yerler.
- Özel modelle sınıflandırma Belirli nesne kategorilerini tanımlamak veya filtrelemek için kendi özel görüntü sınıflandırma modelinizi kullanın. Resmin arka planını çıkararak özel modelinizin performansını artırın.
Örnek sonuçlar
Resimlerdeki en belirgin nesneyi izleme
Aşağıdaki örnekte, ML Kit tarafından sağlanan varsayılan kaba sınıflandırıcıyla üç ardışık karedeki izleme verileri gösterilmektedir.
![]() |
|
||||||||
![]() |
|
||||||||
![]() |
|
Fotoğraf: Christian Ferrer [CC BY-SA 4.0]
Statik bir resimde birden fazla nesne
Aşağıdaki örnekte, resimde algılanan dört nesnenin verileri, ML Kit tarafından sağlanan varsayılan kaba sınıflandırıcıyla birlikte gösterilmektedir.

| Nesne 0 | |
|---|---|
| Sınırlar | (1, 97), (332, 97), (332, 332), (1, 332) |
| Kategori | FASHION_GOOD |
| Sınıflandırma güven düzeyi | 0,95703125 |
| 1. nesne | |
| Sınırlar | (186, 80), (337, 80), (337, 226), (186, 226) |
| Kategori | FASHION_GOOD |
| Sınıflandırma güven düzeyi | 0,84375 |
| 2. nesne | |
| Sınırlar | (296, 80), (472, 80), (472, 388), (296, 388) |
| Kategori | FASHION_GOOD |
| Sınıflandırma güven düzeyi | 0,94921875 |
| 3. nesne | |
| Sınırlar | (439, 83), (615, 83), (615, 306), (439, 306) |
| Kategori | FASHION_GOOD |
| Sınıflandırma güven düzeyi | 0,9375 |
Özel bir LiteRT modeli kullanma
Varsayılan kaba sınıflandırıcı, beş kategori için oluşturulur ve algılanan nesneler hakkında sınırlı bilgi sağlar. Daha dar bir kavram alanını daha ayrıntılı şekilde kapsayan daha uzmanlaşmış bir sınıflandırıcı modeline ihtiyacınız olabilir. Örneğin, çiçek türlerini veya yemek çeşitlerini ayırt etmek için bir model.
Bu API, çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre uyarlama yapmanıza olanak tanır. Daha fazla bilgi için ML Kit ile özel modeller başlıklı makaleyi inceleyin. Özel modeller, uygulamanızla birlikte paketlenebilir veya Cloud Storage'dan dinamik olarak indirilebilir.
Giriş görüntüsünün ön işlenmesi
Gerekirse nesne tespit etme ve izleme, giriş resmi boyutunu ve en-boy oranını temel modelin gereksinimlerine uyacak şekilde ayarlamak için çift doğrusal görüntü ölçeklendirme ve uzatma yöntemlerini kullanır.


