تحدد ميزة "التعرّف على الوجوه" الوجوه البشرية في الوسائط المرئية، مثل الصور الرقمية أو الفيديوهات. وعند التعرّف على وجه معيّن، يكون له وضع وحجم واتجاه مرتبطان به، ويمكن البحث عنه عن معالم مثل العينين والأنف.
في ما يلي بعض المصطلحات التي نستخدمها في ما يتعلق بميزة "التعرّف على الوجوه" في أدوات تعلّم الآلة:
تعمل ميزة تتبُّع الوجه على توسيع نطاق ميزة "التعرّف على الوجوه" لتشمل تسلسلات الفيديوهات. يمكن تتبّع أي وجه يظهر في فيديو لأي مدة زمنية من إطار إلى آخر. ويعني ذلك أنّه يمكن تحديد الوجه الذي يتم التعرّف عليه في إطارات الفيديو المتتالية على أنّه الشخص نفسه. يُرجى العِلم أنّ هذه الميزة ليست من أشكال التعرّف على الوجه، إذ إنّ ميزة تتبُّع الوجوه لا تقدّم استنتاجات تستند إلى موضع الوجوه وحركتها في تسلسل الفيديو.
المَعلم هو نقطة اهتمام في وجه. العين اليسرى والعين اليمنى وقاعدة الأنف كلها أمثلة على المعالم. وتتيح هذه الأدوات إمكانية العثور على المعالم على وجه تم التعرّف عليه.
الخطوط هي مجموعة من النقاط التي تتبع شكل ملامح الوجه. تتيح أدوات تعلّم الآلة إمكانية تحديد محيط الوجه.
يحدد التصنيف ما إذا كانت خاصية معينة للوجه موجودة. على سبيل المثال، يمكن تصنيف الوجه حسب ما إذا كانت عينيه مفتوحتين أو مغلقتين، أو ما إذا كان الوجه يبتسم أم لا.
اتجاه الوجه
تصف المصطلحات التالية الزاوية التي يتم توجيه الوجه إليها في ما يتعلق بالكاميرا:
- أويلر س: وجه لزاوية أويلر س الموجبة موجَّهة للأعلى.
- أويلر ص: وجه ذو زاوية أويلر ص موجبة ينظر إلى يمين الكاميرا أو إلى اليسار إذا كان سالبًا.
- أويلر ع: يتم تدوير وجه بزاوية أويلر Z موجبة في عكس اتجاه عقارب الساعة بالنسبة إلى الكاميرا.
لا تُبلِّغ مجموعة أدوات تعلّم الآلة عن زاوية Euler X أو Euler Y أو Euler Z للوجه الذي تم رصده عند ضبط
LANDMARK_MODE_NONE
وCONTOUR_MODE_ALL
وCLASSIFICATION_MODE_NONE
وPERFORMANCE_MODE_FAST
مع بعضها.
المَعالم
المعلم هو نقطة اهتمام داخل وجه. العين اليسرى والعين اليمنى وقاعدة الأنف كلها أمثلة على المعالم.
ترصد هذه الأداة الوجوه بدون البحث عن المعالم. ميزة "رصد المعالم" هي خطوة اختيارية يتم إيقافها تلقائيًا.
يلخص الجدول التالي جميع المعالم التي يمكن اكتشافها بالنظر إلى زاوية أويلر ص للوجه المرتبط:
زاوية أويلر ص | المَعالم التي يمكن رصدها |
---|---|
< -36 درجة | العين اليسرى، الفم الأيسر، الأذن اليسرى، قاعدة الأنف، الخد الأيسر |
من -36 درجة إلى -12 درجة | الفم الأيسر، قاعدة الأنف، أسفل الفم، العين اليمنى، العين اليسرى، الخد الأيسر، رأس الأذن اليسرى |
من -12 درجة إلى 12 درجة | العين اليمنى، العين اليسرى، قاعدة الأنف، الخد الأيسر، الخد الأيمن، الفم الأيسر، الفم الأيمن، أسفل الفم |
12 درجة إلى 36 درجة | الفم الأيمن، قاعدة الأنف، أسفل الفم، العين اليسرى، العين اليمنى، الخد الأيمن، رأس الأذن الأيمن |
> 36 درجة | العين اليمنى، الفم الأيمن، الأذن اليمنى، قاعدة الأنف، الخد الأيمن |
يتضمّن كل مَعلم تم رصده موضعه المرتبط في الصورة.
خطوط كونتورية
تحديد الوجه هو مجموعة من النقاط التي تمثل شكل ميزة الوجه. توضح الصورة التالية كيفية تحديد هذه النقاط بوجه. انقر فوق الصورة لتكبيرها:
يتم تمثيل كل محيط ميزة ترصده أدوات تعلّم الآلة بعدد ثابت من النقاط:
بيضاوي للوجه | 36 نقطة | الشفة العلوية (العلوية) | 11 نقطة |
---|---|---|---|
الحاجب الأيسر (أعلى) | 5 نقاط | الشفة العلوية (السفلى) | 9 نقاط |
الحاجب الأيسر (أسفل) | 5 نقاط | الشفة السفلى (العلوية) | 9 نقاط |
الحاجب الأيمن (أعلى) | 5 نقاط | الشفة السفلى (السفلى) | 9 نقاط |
الحاجب الأيمن (أسفل) | 5 نقاط | جسر أنف | نقطتان |
العين اليسرى | 16 نقطة | أسفل الأنف | 3 نقاط |
العين اليمنى | 16 نقطة | ||
الخد الأيسر (في الوسط) | نقطة واحدة | ||
الخد الأيمن (المنتصف) | نقطة واحدة |
عند الحصول على جميع خطوط الوجه في وقت واحد، ستحصل على صفيف من 133 نقطة، وتظهر خطوط عليها كما هو موضح أدناه:
مؤشرات خطوط الخصائص | |
---|---|
0-35 | بيضاوي للوجه |
36-40 | الحاجب الأيسر (أعلى) |
41-45 | الحاجب الأيسر (أسفل) |
46-50 | الحاجب الأيمن (أعلى) |
51-55 | الحاجب الأيمن (أسفل) |
56-71 | العين اليسرى |
72-87 | العين اليمنى |
88-96 | الشفة العلوية (السفلى) |
97-105 | الشفة السفلى (العلوية) |
106-116 | الشفة العلوية (العلوية) |
117-125 | الشفة السفلى (السفلى) |
126، 127 | جسر أنف |
128-130 | أسفل الأنف (لاحظ أن النقطة المركزية عند المؤشر 128) |
131 | الخد الأيسر (في الوسط) |
132 | الخد الأيمن (المنتصف) |
التصنيف
يحدد التصنيف ما إذا كانت هناك خصائص وجه معينة موجودة. تتوافق حزمة تعلُّم الآلة حاليًا مع فئتَين: العيون مفتوحة والابتسام.
التصنيف هو قيمة مؤكدة. إنه يشير إلى الثقة في وجود سمات الوجه. على سبيل المثال، تشير القيمة 0.7 أو أكثر لتصنيف الابتسام إلى أنه من المحتمل أن يكون الشخص مبتسمًا.
ويعتمد هذَين التصنيفَين على رصد المعالم.
تجدر الإشارة أيضًا إلى أنّ تصنيفَي "العيون مفتوحة" و "الابتسامة" يناسبان فقط الوجوه الأمامية، أي الوجوه ذات زاوية أويلر Y الصغيرة (بين 18 و18 درجة).
الحد الأدنى لحجم الوجه
الحد الأدنى لحجم الوجه هو حجم الوجه المطلوب، معبرًا عنه بنسبة عرض الرأس إلى عرض الصورة. على سبيل المثال، تعني القيمة 0.1 أن أصغر وجه يمكن البحث عنه يساوي 10% تقريبًا من عرض الصورة التي يتم البحث عنها.
إنّ الحد الأدنى لحجم الوجه هو المفاضلة بين الأداء والدقة: فضبط الحدّ الأدنى للحجم الأصغر حجمًا يتيح لأداة الرصد العثور على وجوه أصغر حجمًا، ولكنّ عملية الرصد ستستغرق وقتًا أطول. قد يؤدي ضبطها على حجم أكبر إلى استبعاد الوجوه الأصغر حجمًا، ولكنّها ستعمل بشكل أسرع.
إنّ الحدّ الأدنى لحجم الوجه ليس حدًا صارمًا، إذ قد ترصد أداة الرصد وجوهًا أصغر قليلاً من الحجم المحدد.
الخطوات التالية
استخدام ميزة "التعرّف على الوجه" في تطبيق iOS أو Android: