Segmentation des sujets

L'API de segmentation du sujet de ML Kit permet aux développeurs de séparer facilement plusieurs sujets de l'arrière-plan d'une image, ce qui permet des cas d'utilisation tels que la création d'autocollants, le changement d'arrière-plan ou l'ajout d'effets sympas à des sujets.

Les sujets sont les personnes, les animaux ou les objets les plus importants qui se trouvent au premier plan de l'image. Si deux sujets sont très proches ou se touchent, ils sont considérés comme un seul sujet.

L'API de segmentation du sujet prend une image d'entrée et génère un masque ou un bitmap de sortie pour le premier plan. Il fournit également un masque et un bitmap pour chacun des sujets détectés (le premier plan est égal à tous les sujets combinés).

Par défaut, le masque et le bitmap de premier plan ont la même taille que l'image d'entrée (la taille du masque et du bitmap de chaque sujet sera probablement différente de celle de l'image d'entrée). Chaque pixel du masque se voit attribuer un nombre flottant dont la plage est comprise entre 0.0 et 1.0. Plus le nombre est proche de 1.0, plus l'indice de confiance que le pixel représente un sujet est élevé, et inversement.

En moyenne, la latence mesurée sur le Pixel 7 Pro est d'environ 200 ms. Cette API n'est actuellement compatible qu'avec les images statiques.

Android

Capacités clés

  • Segmentation multisujets:fournit des masques et des bitmaps pour chaque sujet individuel, au lieu d'un seul masque et bitmap pour tous les sujets combinés.
  • Reconnaissance de sujet:les sujets reconnus sont des objets, des animaux de compagnie et des humains.
  • Traitement sur l'appareil:tous les traitements sont effectués sur l'appareil, ce qui préserve la confidentialité des utilisateurs et ne nécessite aucune connectivité réseau.

Exemples de résultats

Image d'entrée Image + Masque de sortie