La détection de visages consiste à localiser automatiquement les visages humains dans les médias visuels (images ou vidéos numériques). Un visage détecté est signalé à une position avec une taille et une orientation associées. Lorsqu'un visage est détecté, il peut rechercher des points de repère tels que les yeux et le nez.
Voici certains termes que nous utilisons pour aborder la détection de visages et les différentes fonctionnalités de l'API Mobile Vision.
La reconnaissance des visages détermine automatiquement si deux visages sont susceptibles de correspondre à la même personne. Notez qu'à l'heure actuelle, l'API Google Face ne fournit des fonctionnalités que pour la détection de visages, et non pour la reconnaissance faciale.
Le suivi des visages étend la détection des visages aux séquences vidéo. N'importe quel visage qui apparaît dans une vidéo, quelle que soit sa durée, peut être suivi. Autrement dit, les visages détectés dans des images vidéo consécutives peuvent être identifiés comme étant la même personne. Notez qu'il ne s'agit pas d'une forme de reconnaissance des visages. Ce mécanisme permet simplement d'effectuer des inférences en fonction de la position et du mouvement des visages dans une séquence vidéo.
Un point de repère est un point d'intérêt dans une face. L'œil gauche, l'œil droit et la base du nez sont des exemples de points de repère. L'API Face permet de trouver des points de repère sur un visage détecté.
La classification détermine si une certaine caractéristique du visage est présente. Par exemple, un visage peut être classé selon qu'il a les yeux ouverts ou fermés. Un autre exemple est de savoir si le visage sourit ou non.
Orientation du visage
L'API Face détecte les visages sous différents angles, comme illustré ci-dessous:
(a) | (b) |
---|---|
![]() |
![]() |
Fig. 1. Estimation de l'angle de pose. (a) Le système de coordonnées avec l'image dans le plan XY et l'axe Z sortant de la figure. (b) Exemples d'angles de pose : e==Euler Y, r==Euler Z.
Les angles Euler X, Euler Y et Euler Z caractérisent l'orientation d'un visage, comme le montre la figure 1. L'API Face fournit des mesures d'Euler Y et d'Euler Z (mais pas d'Euler X) pour les visages détectés.
L'angle Z d'Euler du visage est toujours signalé. L'angle Euler Y n'est disponible que lorsque vous utilisez le paramètre de mode "précis" du détecteur de visages (par opposition au paramètre de mode "rapide"), qui permet d'accélérer la détection de certains raccourcis. L'angle Euler X n'est actuellement pas pris en charge.
Landmarks
Un point de repère est un point d'intérêt dans une face. L'œil gauche, l'œil droit et la base du nez sont des exemples de points de repère. La figure ci-dessous présente quelques exemples de points de repère:
Plutôt que de commencer par détecter les points de repère et de les utiliser comme base pour détecter l'intégralité du visage, l'API Face détecte l'ensemble du visage indépendamment des informations détaillées sur les points de repère. Pour cette raison, la détection des points de repère est une étape facultative qui peut être effectuée après la détection du visage. La détection des points de repère n'est pas effectuée par défaut, car son exécution prend plus de temps. Vous pouvez éventuellement spécifier que la détection des points de repère doit être effectuée.
Le tableau suivant récapitule tous les points de repère pouvant être détectés pour un angle Y d'Euler sur un visage associé:
Angle Y d'Euler | points de repère détectables |
---|---|
< -36 degrés | œil gauche, bouche gauche, oreille gauche, base du nez, joue gauche |
-36 degrés à -12 degrés | bouche gauche, base du nez, bouche inférieure, œil droit, œil gauche, joue gauche, embout gauche |
-12 degrés à 12 degrés | œil droit, œil gauche, base du nez, joue gauche, joue droite, bouche gauche, bouche droite, bouche inférieure |
12 à 36 degrés | bouche droite, base du nez, bouche inférieure, œil gauche, œil droit, joue droite, embout droit |
> 36 degrés | œil droit, bouche droite, oreille droite, base du nez, joue droite |
Chaque point de repère détecté inclut sa position dans l'image.
Classification
La classification détermine si une certaine caractéristique du visage est présente. L'API Android Face accepte actuellement deux classifications : œil ouvert et sourire. L'API iOS Face est actuellement compatible avec la classification souriant. La classification est exprimée sous la forme d'une valeur de certitude, indiquant la confiance en la présence de la caractéristique du visage. Par exemple, une valeur de 0,7 ou plus pour la classification "sourire" indique qu'il est probable qu'une personne sourie.
Ces deux classifications reposent sur la détection de points de repère.
Notez également que la classification des yeux ouverts et des sourires ne fonctionne que pour les visages frontaux, c'est-à-dire les visages avec un petit angle de Y d'Euler (maximum de +/- 18 degrés).
Étapes suivantes
Consultez nos guides de détection des visages sur iOS et Android: