مفاهیم تشخیص چهره

تشخیص چهره چهره های انسان را در رسانه های بصری مانند تصاویر دیجیتال یا ویدئو تعیین می کند. هنگامی که چهره ای شناسایی می شود، دارای موقعیت، اندازه و جهت مرتبط است. و می توان آن را برای نشانه هایی مانند چشم و بینی جستجو کرد.

در اینجا برخی از اصطلاحاتی که در مورد ویژگی تشخیص چهره کیت ML استفاده می کنیم آورده شده است:

  • ردیابی چهره تشخیص چهره را به دنباله‌های ویدیویی گسترش می‌دهد. هر چهره ای که برای مدت زمان طولانی در یک ویدیو ظاهر می شود را می توان از فریم به فریم ردیابی کرد. این بدان معنی است که چهره ای که در فریم های ویدیویی متوالی شناسایی می شود می تواند به عنوان همان شخص شناسایی شود. توجه داشته باشید که این یک نوع تشخیص چهره نیست. ردیابی چهره فقط بر اساس موقعیت و حرکت چهره ها در یک دنباله ویدیو استنباط می کند.

  • یک نقطه عطف ، یک نقطه مورد علاقه در یک چهره است. چشم چپ، چشم راست و پایه بینی همگی نمونه هایی از نشانه ها هستند. کیت ML امکان یافتن نقاط عطف در چهره شناسایی شده را فراهم می کند.

  • کانتور مجموعه ای از نقاط است که از شکل یک ویژگی صورت پیروی می کنند. کیت ML توانایی پیدا کردن خطوط صورت را فراهم می کند.

  • طبقه بندی مشخص می کند که آیا یک ویژگی چهره خاص وجود دارد یا خیر. به عنوان مثال، صورت را می توان بر اساس باز یا بسته بودن چشمانش یا خندان بودن یا نبودن صورت طبقه بندی کرد.

جهت گیری صورت

عبارات زیر زاویه ای را که یک چهره نسبت به دوربین جهت گیری می کند توصیف می کند:

  • اویلر X : صورت با زاویه اویلر X مثبت رو به بالا است.
  • اویلر Y : چهره ای با زاویه اویلر Y مثبت به سمت راست دوربین یا در صورت منفی به سمت چپ نگاه می کند.
  • اویلر Z : چهره ای با زاویه مثبت اویلر Z نسبت به دوربین در خلاف جهت عقربه های ساعت می چرخد.

وقتی LANDMARK_MODE_NONE ، CONTOUR_MODE_ALL ، CLASSIFICATION_MODE_NONE و PERFORMANCE_MODE_FAST با هم تنظیم شده‌اند، کیت ML زاویه اویلر X، اویلر Y یا اویلر Z یک چهره شناسایی‌شده را گزارش نمی‌کند.

نقاط دیدنی

یک نقطه عطف، یک نقطه مورد علاقه در یک چهره است. چشم چپ، چشم راست و پایه بینی همگی نمونه هایی از نشانه ها هستند.

کیت ML چهره ها را بدون جستجوی نشانه ها تشخیص می دهد. تشخیص نشانه یک مرحله اختیاری است که به طور پیش فرض غیرفعال است.

جدول زیر تمام نشانه هایی را که می توان با توجه به زاویه اویلر Y یک چهره مرتبط تشخیص داد، خلاصه می کند:

زاویه اویلر Y نقاط دیدنی قابل تشخیص
< -36 درجه چشم چپ، دهان چپ، گوش چپ، پایه بینی، گونه چپ
-36 درجه تا -12 درجه دهان چپ، پایه بینی، پایین دهان، چشم راست، چشم چپ، گونه چپ، نوک گوش چپ
-12 درجه تا 12 درجه چشم راست، چشم چپ، پایه بینی، گونه چپ، گونه راست، دهان چپ، دهان راست، دهان پایین
12 درجه تا 36 درجه دهان راست، پایه بینی، پایین دهان، چشم چپ، چشم راست، گونه راست، نوک گوش راست
> 36 درجه چشم راست، دهان راست، گوش راست، پایه بینی، گونه راست

هر نقطه عطف شناسایی شده شامل موقعیت مرتبط خود در تصویر است.

خطوط

کانتور مجموعه ای از نقاط است که شکل یک ویژگی صورت را نشان می دهد. تصویر زیر نشان می دهد که چگونه این نقاط به یک چهره نگاشت می شوند. بر روی عکس کلیک کنید تا بزرگتر نمایش داده شود:

هر کانتور ویژگی که ML Kit تشخیص می دهد با تعداد ثابتی از نقاط نشان داده می شود:

صورت بیضی شکل 36 امتیاز لب بالا (بالا) 11 امتیاز
ابروی چپ (بالا) 5 امتیاز لب بالا (پایین) 9 امتیاز
ابروی چپ (پایین) 5 امتیاز لب پایین (بالا) 9 امتیاز
ابروی راست (بالا) 5 امتیاز لب پایین (پایین) 9 امتیاز
ابروی راست (پایین) 5 امتیاز پل بینی 2 امتیاز
چشم چپ 16 امتیاز پایین بینی 3 امتیاز
چشم راست 16 امتیاز
گونه چپ (مرکز) 1 امتیاز
گونه راست (مرکز) 1 امتیاز

هنگامی که تمام خطوط یک چهره را به طور همزمان دریافت می کنید، آرایه ای از 133 نقطه به دست می آورید که مطابق شکل زیر، خطوط را نشان می دهد:

شاخص خطوط مشخصه
0-35 صورت بیضی شکل
36-40 ابروی چپ (بالا)
41-45 ابروی چپ (پایین)
46-50 ابروی راست (بالا)
51-55 ابروی راست (پایین)
56-71 چشم چپ
72-87 چشم راست
88-96 لب بالا (پایین)
97-105 لب پایین (بالا)
106-116 لب بالا (بالا)
117-125 لب پایین (پایین)
126، 127 پل بینی
128-130 پایین بینی (توجه داشته باشید که نقطه مرکزی در شاخص 128 است)
131 گونه چپ (مرکز)
132 گونه راست (مرکز)

طبقه بندی

طبقه بندی مشخص می کند که آیا یک ویژگی چهره خاص وجود دارد یا خیر. کیت ML در حال حاضر از دو طبقه بندی پشتیبانی می کند: چشمان باز و خندان .

طبقه بندی یک ارزش قطعی است. این نشان دهنده اطمینان از وجود یک ویژگی چهره است. به عنوان مثال، مقدار 0.7 یا بیشتر برای طبقه‌بندی خندان نشان می‌دهد که احتمالاً فردی در حال لبخند زدن است.

هر دوی این طبقه بندی ها بر تشخیص نقطه عطف متکی هستند.

همچنین توجه داشته باشید که طبقه بندی "چشم باز" و "خندان" فقط برای صورت های جلویی کار می کند، یعنی چهره هایی با زاویه اویلر Y کوچک (بین -18 تا 18 درجه).

حداقل اندازه صورت

حداقل اندازه صورت، اندازه صورت مورد نظر است که به صورت نسبت عرض سر به عرض تصویر بیان می شود. به عنوان مثال، مقدار 0.1 به این معنی است که کوچکترین چهره برای جستجو تقریباً 10٪ از عرض تصویر مورد جستجو است.

حداقل اندازه چهره یک مبادله عملکرد در مقابل دقت است: تنظیم حداقل اندازه کوچکتر به آشکارساز اجازه می‌دهد تا چهره‌های کوچک‌تر را پیدا کند، اما تشخیص بیشتر طول می‌کشد. بزرگ‌تر کردن آن ممکن است چهره‌های کوچک‌تر را حذف کند، اما سریع‌تر اجرا می‌شود.

حداقل اندازه صورت یک محدودیت سخت نیست. آشکارساز ممکن است چهره هایی را کمی کوچکتر از آنچه مشخص شده است بیابد.

مراحل بعدی

از تشخیص چهره در برنامه iOS یا Android خود استفاده کنید: