تشخیص و ردیابی اشیاء

با استفاده از API تشخیص و ردیابی اشیاء روی دستگاه ML Kit، می‌توانید اشیاء را در یک تصویر یا فید دوربین زنده تشخیص داده و ردیابی کنید.

به صورت اختیاری، می‌توانید اشیاء شناسایی شده را یا با استفاده از طبقه‌بندی‌کننده‌ی تقریبیِ تعبیه‌شده در API یا با استفاده از مدل طبقه‌بندی تصویر سفارشی خودتان، طبقه‌بندی کنید. برای اطلاعات بیشتر به بخش «استفاده از مدل سفارشی LiteRT» مراجعه کنید.

از آنجا که تشخیص و ردیابی اشیا روی دستگاه اتفاق می‌افتد، به عنوان بخش جلویی خط لوله جستجوی بصری به خوبی کار می‌کند. پس از تشخیص و فیلتر کردن اشیا، می‌توانید آنها را به یک بخش پشتی ابری، مانند جستجوی محصول Cloud Vision ، منتقل کنید.

آی‌او‌اس اندروید

قابلیت‌های کلیدی

  • تشخیص و ردیابی سریع اشیا: اشیا را تشخیص داده و مکان آنها را در تصویر مشخص کنید. اشیا را در فریم‌های تصویر متوالی ردیابی کنید.
  • مدل بهینه‌شده روی دستگاه مدل تشخیص و ردیابی اشیا برای دستگاه‌های تلفن همراه بهینه شده و برای استفاده در برنامه‌های بلادرنگ، حتی در دستگاه‌های رده پایین، در نظر گرفته شده است.
  • تشخیص اشیاء برجسته: به طور خودکار برجسته‌ترین شیء در یک تصویر را تعیین می‌کند.
  • طبقه‌بندی کلی: اشیاء را در دسته‌های کلی طبقه‌بندی کنید، که می‌توانید از آنها برای فیلتر کردن اشیاء مورد علاقه‌تان استفاده کنید. دسته‌های زیر پشتیبانی می‌شوند: کالاهای خانگی، کالاهای مد، غذا، گیاهان و مکان‌ها.
  • طبقه‌بندی با یک مدل سفارشی از مدل طبقه‌بندی تصویر سفارشی خود برای شناسایی یا فیلتر کردن دسته‌های خاص اشیاء استفاده کنید. با حذف پس‌زمینه تصویر، عملکرد مدل سفارشی خود را بهبود بخشید.

نتایج مثال

ردیابی برجسته‌ترین شیء در تصاویر

مثال زیر داده‌های ردیابی را از سه فریم متوالی با طبقه‌بندی‌کننده‌ی تقریبی پیش‌فرض ارائه شده توسط ML Kit نشان می‌دهد.

شناسه ردیابی 0
مرزها (95، 45)، (496، 45)، (496، 240)، (95، 240)
دسته بندی مکان
اطمینان طبقه‌بندی ۰.۹۲۹۶۸۷۵
شناسه ردیابی 0
مرزها (84، 46)، (478، 46)، (478، 247)، (84، 247)
دسته بندی مکان
اطمینان طبقه‌بندی ۰.۸۷۱۰۹۳۸
شناسه ردیابی 0
مرزها (53، 45)، (519، 45)، (519، 240)، (53، 240)
دسته بندی مکان
اطمینان طبقه‌بندی ۰.۸۸۲۸۱۲۵

عکس: کریستین فرر [CC BY-SA 4.0]

چندین شیء در یک تصویر ثابت

مثال زیر داده‌های مربوط به چهار شیء شناسایی‌شده در تصویر را با استفاده از طبقه‌بندی‌کننده‌ی تقریبی پیش‌فرض ارائه‌شده توسط ML Kit نشان می‌دهد.

کفش

شیء ۰
مرزها (1، 97)، (332، 97)، (332، 332)، (1، 332)
دسته بندی مد_خوب
اطمینان طبقه‌بندی ۰.۹۵۷۰۳۱۲۵
شیء ۱
مرزها (186، 80)، (337، 80)، (337، 226)، (186، 226)
دسته بندی مد_خوب
اطمینان طبقه‌بندی ۰.۸۴۳۷۵
شیء ۲
مرزها (296، 80)، (472، 80)، (472، 388)، (296، 388)
دسته بندی مد_خوب
اطمینان طبقه‌بندی ۰.۹۴۹۲۱۸۷۵
شیء ۳
مرزها (۴۳۹، ۸۳)، (۶۱۵، ۸۳)، (۶۱۵، ۳۰۶)، (۴۳۹، ۳۰۶)
دسته بندی مد_خوب
اطمینان طبقه‌بندی ۰.۹۳۷۵

استفاده از یک مدل LiteRT سفارشی

طبقه‌بندی‌کننده‌ی پیش‌فرضِ کلی برای پنج دسته ساخته شده است و اطلاعات محدودی در مورد اشیاء شناسایی‌شده ارائه می‌دهد. ممکن است به یک مدل طبقه‌بندی‌کننده‌ی تخصصی‌تر نیاز داشته باشید که دامنه‌ی محدودتری از مفاهیم را با جزئیات بیشتری پوشش دهد؛ برای مثال، مدلی برای تمایز بین گونه‌های گل یا انواع غذا.

این API با پشتیبانی از مدل‌های طبقه‌بندی تصویر سفارشی از طیف وسیعی از منابع، به شما امکان می‌دهد تا با یک مورد استفاده خاص، آن را سفارشی‌سازی کنید. برای کسب اطلاعات بیشتر به مدل‌های سفارشی با کیت ML مراجعه کنید. مدل‌های سفارشی را می‌توان با برنامه شما همراه کرد یا به صورت پویا از فضای ذخیره‌سازی ابری دانلود کرد.

آی‌او‌اس اندروید

پیش‌پردازش تصویر ورودی

در صورت نیاز، تشخیص و ردیابی شیء از مقیاس‌بندی و کشش تصویر دوخطی برای تنظیم اندازه تصویر ورودی و نسبت ابعاد آن استفاده می‌کند تا با الزامات مدل زیربنایی مطابقت داشته باشد.