Nesne algılama ve izleme

ML Kit'in cihaz üzerinde nesne tespit etme ve izleme API'si ile bir resimdeki veya canlı kamera feed'indeki nesneleri tespit edip izleyebilirsiniz.

İsteğe bağlı olarak, algılanan nesneleri sınıflandırabilirsiniz. Bunun için API'ye yerleştirilmiş kaba sınıflandırıcıyı veya kendi özel görüntü sınıflandırma modelinizi kullanabilirsiniz. Daha fazla bilgi için Özel bir LiteRT modeli kullanma başlıklı makaleyi inceleyin.

Nesne tespit etme ve izleme cihazda gerçekleştiğinden, görsel arama ardışık düzeninin ön ucu olarak iyi çalışır. Nesneleri algılayıp filtreledikten sonra Cloud Vision Product Search gibi bir bulut arka ucuna iletebilirsiniz.

iOS Android

Temel özellikler

  • Hızlı nesne tespit etme ve izleme Nesneleri tespit edin ve görüntüdeki konumlarını öğrenin. Nesneleri ardışık görüntü karelerinde izleyin.
  • Optimize edilmiş cihaz üzerinde model Nesne tespit etme ve izleme modeli, mobil cihazlar için optimize edilmiştir ve daha düşük seviyeli cihazlarda bile gerçek zamanlı uygulamalarda kullanılmak üzere tasarlanmıştır.
  • Öne çıkan nesne tespit etme Bir resimdeki en öne çıkan nesneyi otomatik olarak belirleyin.
  • Kaba sınıflandırma Nesneleri geniş kategorilere ayırın. Bu kategorileri, ilgilenmediğiniz nesneleri filtrelemek için kullanabilirsiniz. Aşağıdaki kategoriler desteklenir: ev ürünleri, moda ürünleri, gıda, bitkiler ve yerler.
  • Özel modelle sınıflandırma Belirli nesne kategorilerini tanımlamak veya filtrelemek için kendi özel görüntü sınıflandırma modelinizi kullanın. Resmin arka planını çıkararak özel modelinizin performansını artırın.

Örnek sonuçlar

Resimlerdeki en belirgin nesneyi izleme

Aşağıdaki örnekte, ML Kit tarafından sağlanan varsayılan kaba sınıflandırıcıyla üç ardışık karedeki izleme verileri gösterilmektedir.

İzleme Kimliği 0
Sınırlar (95, 45), (496, 45), (496, 240), (95, 240)
Kategori PLACE
Sınıflandırma güven düzeyi 0,9296875
İzleme Kimliği 0
Sınırlar (84, 46), (478, 46), (478, 247), (84, 247)
Kategori PLACE
Sınıflandırma güven düzeyi 0,8710938
İzleme Kimliği 0
Sınırlar (53, 45), (519, 45), (519, 240), (53, 240)
Kategori PLACE
Sınıflandırma güven düzeyi 0,8828125

Fotoğraf: Christian Ferrer [CC BY-SA 4.0]

Statik bir resimde birden fazla nesne

Aşağıdaki örnekte, resimde algılanan dört nesnenin verileri, ML Kit tarafından sağlanan varsayılan kaba sınıflandırıcıyla birlikte gösterilmektedir.

Ayakkabılar

Nesne 0
Sınırlar (1, 97), (332, 97), (332, 332), (1, 332)
Kategori FASHION_GOOD
Sınıflandırma güven düzeyi 0,95703125
1. nesne
Sınırlar (186, 80), (337, 80), (337, 226), (186, 226)
Kategori FASHION_GOOD
Sınıflandırma güven düzeyi 0,84375
2. nesne
Sınırlar (296, 80), (472, 80), (472, 388), (296, 388)
Kategori FASHION_GOOD
Sınıflandırma güven düzeyi 0,94921875
3. nesne
Sınırlar (439, 83), (615, 83), (615, 306), (439, 306)
Kategori FASHION_GOOD
Sınıflandırma güven düzeyi 0,9375

Özel bir LiteRT modeli kullanma

Varsayılan kaba sınıflandırıcı, beş kategori için oluşturulur ve algılanan nesneler hakkında sınırlı bilgi sağlar. Daha dar bir kavram alanını daha ayrıntılı şekilde kapsayan daha uzmanlaşmış bir sınıflandırıcı modeline ihtiyacınız olabilir. Örneğin, çiçek türlerini veya yemek çeşitlerini ayırt etmek için bir model.

Bu API, çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre uyarlama yapmanıza olanak tanır. Daha fazla bilgi için ML Kit ile özel modeller başlıklı makaleyi inceleyin. Özel modeller, uygulamanızla birlikte paketlenebilir veya Cloud Storage'dan dinamik olarak indirilebilir.

iOS Android

Giriş görüntüsünün ön işlenmesi

Gerekirse nesne tespit etme ve izleme, giriş resmi boyutunu ve en-boy oranını temel modelin gereksinimlerine uyacak şekilde ayarlamak için çift doğrusal görüntü ölçeklendirme ve uzatma yöntemlerini kullanır.