圖片標籤

您可以使用 ML Kit 的圖片標籤 API,偵測及擷取圖片中廣泛類別的實體相關資訊。預設圖片標籤模型可辨識一般物件、地點、活動、動物物種和產品等內容。

您也可以使用自訂圖片分類模型,根據特定用途調整偵測功能。詳情請參閱「使用自訂 LiteRT 模型」。

主要功能

  • 強大的通用基礎分類器 可辨識超過 400 個類別,描述相片中最常見的物件。
  • 使用自訂模型,根據您的用途調整 使用 TensorFlow Hub 中的其他預先訓練模型,或是使用 TensorFlow、AutoML 或 LiteRT 訓練的自訂模型。
  • 簡單易用的高階 API 不必處理低階模型輸入/輸出、圖片預先處理和後續處理,也不用建構處理管道。ML Kit 會從 LiteRT 模型擷取標籤,並以文字說明的形式提供。

請注意,這個 API 適用於描述完整圖片的圖片分類模型。如要分類圖片中的一或多個物件 (例如鞋子或家具),物件偵測與追蹤 API 可能更適合。

支援的圖片分類模型

圖像標籤 API 支援不同的圖像分類模型:

支援的圖片分類模型
基礎模型 根據預設,API 會使用功能強大的一般用途圖片標籤模型,可辨識超過 400 個實體,涵蓋相片中最常見的概念。
自訂 LiteRT 模型 如要鎖定特定應用程式的概念,API 可接受來自各種來源的自訂圖像分類模型。這些模型可以是從 TensorFlow Hub 下載的預先訓練模型,也可以是您使用 AutoML、LiteRT 或 TensorFlow 本身訓練的模型。模型可以與應用程式一併封裝,也可以透過 Cloud Storage 代管,並在執行階段下載。

使用基礎模型

ML Kit 的基礎模型會傳回實體清單,識別人物、事物、地點、活動等。每個實體都有一個分數,代表機器學習模型對實體相關性的信心程度。有了這項資訊,您就能執行自動產生中繼資料和內容審查等工作。ML Kit 提供的預設模型可辨識超過 400 種不同的實體

iOS Android

標籤範例

圖片標籤 API 中的基礎模型支援 400 多個標籤,例如:

類別標籤範例
人物 Crowd
Selfie
Smile
活動 Dancing
Eating
Surfing
事物 Car
Piano
Receipt
動物 Bird
Cat
Dog
植物 Flower
Fruit
Vegetable
地點 Beach
Lake
Mountain

搜尋結果範例

以下是隨附相片中辨識出的實體範例。

相片:Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
標籤 0
Text 體育場館
提升信心 0.9205354
標籤 1
Text 運動
提升信心 0.7531109
標籤 2
Text 事件
提升信心 0.66905296
標籤 3
Text 休閒
提升信心 0.59904146
標籤 4
Text 足球
提升信心 0.56384534
標籤 5
Text 淨收益
提升信心 0.54679185
標籤 6
Text 植物
提升信心 0.524364

使用自訂 LiteRT 模型

ML Kit 的基礎圖像標籤模型是為一般用途而建構。這項模型經過訓練,可辨識 400 個類別,描述相片中最常見的物件。您的應用程式可能需要專門的圖片分類模型,以便更詳細地辨識較少數量的類別,例如區分花卉品種或食物類型的模型。

這項 API 支援來自各種來源的自訂圖片分類模型,可讓您根據特定用途進行調整。詳情請參閱「使用 ML Kit 的自訂模型」。自訂模型可與應用程式一併封裝,或從 Cloud Storage 動態下載。

iOS Android

輸入圖片預處理

如有需要,圖片標記會使用雙線性圖片縮放和延展功能,調整輸入圖片的大小和顯示比例,以符合基礎模型的需求。