臉部偵測概念

臉部偵測功能會在視覺媒體 (例如數位圖片或影片) 中尋找人臉。當偵測到臉孔有相關聯的位置、大小和方向,可以搜尋眼睛和鼻子等地標。

以下是與 ML Kit 臉部偵測功能相關的一些字詞:

  • 臉部追蹤可將臉部偵測功能擴展到影片序列,從影格到每個影格,都能追蹤片中長度任意長度的臉孔。這表示在連續視訊影格中偵測到的臉孔,可識別為同一個人。請注意,這不是「臉部辨識」的形式。臉部追蹤只會根據影片序列中臉孔的位置和動作進行推論。

  • 「地標」是指表面中的搜尋點。左眼、右眼和鼻子都是地標的例子。ML Kit 可讓您在偵測到的臉孔中尋找地標。

  • 輪廓是一組隨臉部地圖項目形狀的點。ML Kit 提供找出臉部的輪廓。

  • 「分類」可判斷是否存在特定的臉部特徵。舉例來說,您可將臉孔區分為面部處於開啟或關閉、笑臉、笑臉等。

正面

以下字詞說明臉孔與相機相關的角度:

  • Euler X:帶有正 X 角的臉孔朝上。
  • Euler Y:帶有正數 Y 角的臉部朝向相機右側,如為負數,請向左尋找。
  • Euler Z:帶有正 Z 角的臉孔,相對於相機,其逆時針旋轉。

LANDMARK_MODE_NONECONTOUR_MODE_ALLCLASSIFICATION_MODE_NONEPERFORMANCE_MODE_FAST 一起設定時,ML Kit 不會回報偵測到的臉部的 Euler X、Euler Y 或 Euler Z 角度。

地標

地標是指臉孔中的搜尋點。左眼、右眼和鼻子都是地標的範例。

ML Kit 無須尋找地標即可偵測臉孔。地標偵測功能為選用步驟,預設為停用。

下表摘要列出若特定臉孔的 Y 軸角度,可以偵測到的所有地標:

歐拉 Y 角 可偵測的地標
< -36 度 左眼, 左眼, 左耳, 鼻基, 左腳
-36 度到 -12 度 左嘴, 鼻子, 下口, 下眼, 右眼, 左眼, 左溪, 左耳塞套
-12 度到 12 度 右眼, 左眼, 鼻子, 左溪, 右溪, 左嘴, 右嘴, 下嘴
12 度到 36 度 右嘴, 鼻子, 下口, 左眼, 左眼, 右眼, 右溪, 右耳塞套
> 36 度 右眼, 右眼, 右耳, 鼻基, 右臉頰

每個偵測到的地標在圖片中都有相關聯的位置。

輪廓

輪廓是一組點,代表臉部特徵的形狀。下圖說明這些點如何對應到臉孔。按一下圖片即可放大:

每個 ML Kit 偵測到的特徵輪廓會以固定數量的點表示:

橢圓形 36 分 上唇 (頂部) 11 分
左眉 (上方) 5 分 上唇 (底部) 9 分
左眉 (底部) 5 分 下唇 (頂部) 9 分
右眉 (上方) 5 分 下唇 (底部) 9 分
右眉 (底部) 5 分 鼻橋 2 分
左眼 16 分 鼻子底部 3 分
右眼 16 分
左溪 (中間) 1 分
右溪 (中間) 1 分

一次取得所有臉孔的輪廓時,您會收到包含 133 個點的陣列,該陣列會對應至不同的輪廓,如下所示:

特徵輪廓的索引
0-35 橢圓形
36-40 左眉 (上方)
41-45 左眉 (底部)
46-50 右眉 (上方)
51-55 右眉 (底部)
56-71 左眼
72-87 右眼
88-96 上唇 (底部)
97-105 下唇 (頂部)
106-116 上唇 (頂部)
117-125 下唇 (底部)
126、127 鼻橋
128-130 下鼻子 (請注意,中心點位於索引 128)
131 左溪 (中間)
132 右溪 (中間)

分類

分類可決定特定臉部特徵是否存在。 ML Kit 目前支援兩種分類:「眼睛開放」和「笑臉」

分類是確定值。代表臉部特徵存在的信賴水準。舉例來說,如果值為 0.7 以上的圖片分類,表示某人可能有在微笑。

這兩種分類都必須仰賴地標偵測。

另請注意,「眼睛開放」和「面露笑」分類僅適用於正面臉孔,也就是較小的歐拉 Y 角 (介於 -18 到 18 度之間) 的臉孔。

臉部最小尺寸

最小臉孔大小是所需的臉孔大小,以頭部的寬度與圖片寬度的比例表示。舉例來說,值為 0.1 表示要搜尋的最小臉孔約佔搜尋圖片寬度的 10%。

臉孔最小尺寸代表效能與準確率的取捨:設定較小的臉孔下限可讓偵測工具找到較小的臉孔,但偵測所需的時間較長;設定較大的臉孔可能會排除較小的臉孔,但執行速度更快。

臉孔大小下限並非硬性限制;偵測工具可能會找到比指定範圍稍小的臉孔。

後續步驟

在 iOS 或 Android 應用程式中使用臉部偵測功能: