اكتشاف الوجه هي عملية تحديد الوجوه البشرية تلقائيًا في الوسائط المرئية (الصور الرقمية أو الفيديوهات). يتم الإبلاغ عن الوجه الذي يتم اكتشافه في موضع ذي حجم واتجاهات مقترنين. وبعد اكتشاف الوجه، يمكن البحث عنه مثل المعالم مثل العينين والأنف.
في ما يلي بعض المصطلحات التي نستخدمها في مناقشة اكتشاف الوجوه والوظائف المختلفة لواجهة برمجة التطبيقات Mobile Vision API.
تحدد ميزة التعرّف على الوجوه تلقائيًا ما إذا كان هناك وجهان من المحتمل أن يتطابقا مع الشخص نفسه. تجدر الإشارة إلى أنه في الوقت الحالي لا توفر واجهة برمجة تطبيقات الوجه من Google إلا ميزة اكتشاف الوجه وليس ميزة التعرف على الوجه.
تعمل ميزة التعرّف على الوجه على توسيع نطاق ميزة "التعرّف على الوجوه" إلى تسلسلات الفيديو. يمكن تتبع أي وجه يظهر في الفيديو لأي مدة زمنية. بمعنى أن الوجوه التي يتم اكتشافها في إطارات فيديو متتالية يمكن تصنيفها على أنها الشخص نفسه. ملاحظة: هذه ليست شكلاً من أشكال التعرّف على الوجوه، بل تعمل هذه الآلية فقط على الاستنتاج استنادًا إلى موضع ووجوه الوجوه في تسلسل الفيديو.
العلامة الموضعية هي نقطة اهتمام في الوجه. فالعين اليسرى والعين اليمنى وقاعدة الأنف جميعها أمثلة على المعالم. توفر واجهة برمجة تطبيقات الوجه إمكانية العثور على المعالم على وجه تم اكتشافه.
يحدد التصنيف ما إذا كانت إحدى خصائص الوجه موجودة. على سبيل المثال، يمكن تصنيف الوجه في ما إذا كانت عيناه مفتوحتين أو مغلقتين. ومثال آخر على ذلك هو ما إذا كان الوجه يبتسم أم لا.
اتجاه الوجه
ترصد واجهة برمجة تطبيقات الوجه الوجوه من زوايا مختلفة، كما هو موضّح أدناه:
(أ) | (ب) |
---|---|
![]() |
![]() |
شكل 1. وضع زاوية التقدير. (أ) نظام الإحداثي مع الصورة في المستوى س ص والمحور ع الناتج عن الشكل. (ب) اصنع أمثلة لزاوية حيث يساوي&Euler Y, r==Euler Z.
تحدد زوايا Euler X وEuler Y وEuler Z اتجاه الوجه كما هو موضح في الشكل 1. توفّر واجهة برمجة تطبيقات الوجه قياسًا للوجهَين Euler Y وEuler Z (وليس Euler X) للوجوه التي تم رصدها.
يتم دائمًا الإبلاغ عن زاوية Euler Z للوجه. لا تتوفر زاوية Euler Y إلا عند استخدام إعداد الوضع "الدقيق" لأداة اكتشاف الوجه (على العكس من إعداد الوضع "السريع" الذي يستغرق بعض الاختصارات لتسريع الاكتشاف). زاوية Euler X غير معتمدة حاليًا.
المَعالم
المَعلم هو نقطة اهتمام ضمن الوجه. فالعين اليسرى والعين اليمنى وقاعدة الأنف جميعها أمثلة على المعالم. ويوضح الشكل التالي بعض الأمثلة للمعالم:
وبدلاً من اكتشاف المعالم أولاً واستخدام المعالم كأساس لاكتشاف الوجه بأكمله، فإن واجهة برمجة تطبيقات الوجه تكتشف الوجه بأكمله بشكل مستقل عن معلومات المعالم التفصيلية. لهذا السبب، يعدّ اكتشاف المَعلم خطوة اختيارية يمكن تنفيذها بعد اكتشاف الوجه. لا يتم اكتشاف المعالم بشكل افتراضي، نظرًا لأن التشغيل يستغرق وقتًا إضافيًا. ويمكنك تحديد تحديد ما إذا كان يجب الكشف عن المَعلم.
يلخص الجدول التالي جميع المعالم التي يمكن اكتشافها، للوجه المرتبط يولر زاي:
زاوية أويلر ص | معالم قابلة للاكتشاف |
---|---|
< -36 درجة | العين اليسرى، الفم الأيسر، الأذن اليسرى، قاعدة الأنف، الخد الأيسر |
-36 درجة إلى -12 درجة | الفم الأيسر، قاعدة الأنف، الفم السفلي، العين اليمنى، العين اليسرى، الخد الأيسر، طرف الأذن الأيسر |
-12 درجة إلى 12 درجة | العين اليمنى، العين اليسرى، قاعدة الأنف، الخد الأيسر، الخد الأيمن، الفم الأيسر، الفم الأيمن، الفم السفلي |
من 12 إلى 36 درجة | الفم الأيمن، قاعدة الأنف، الفم السفلي، العين اليسرى، العين اليمنى، الخد الأيمن، طرف الأذن الأيمن |
> 36 درجة | العين اليمنى، الفم الأيمن، الأذن اليمنى، قاعدة الأنف، الخد الأيمن |
يتضمّن كل مَعلم تم رصده موضعه المرتبط في الصورة.
التصنيف
يحدد التصنيف ما إذا كانت إحدى خصائص الوجه موجودة أم لا. تتوافق واجهة برمجة تطبيقات Android Face حاليًا مع تصنيفين: عين مفتوحة وابتسام. تدعم واجهة برمجة تطبيقات iOS Face حاليًا التصنيف مبتسم. يتم التعبير عن التصنيف كقيمة مؤكدة، مما يشير إلى الثقة في أن خاصية الوجه موجودة. على سبيل المثال، تشير القيمة 0.7 أو أكثر لتصنيف الابتسام إلى أن الشخص يبتسم على الأرجح.
ويعتمد هذان التصنيفان على اكتشاف المَعلم.
تجدر الإشارة أيضًا إلى أن التصنيفين "عينان مفتوحتان" و"ابتسام" لا يعملان إلا مع الواجهات الأمامية، أي الوجوه ذات الزاوية الصغيرة "أولر ص" (في حدود 18 درجة تقريبًا أو أكثر).
الخطوات التالية
يُرجى قراءة أدلة اكتشاف الوجوه على نظامي التشغيل iOS وAndroid: