
您可以使用 ML Kit 的圖片標籤 API,偵測及擷取圖片中廣泛類別的實體相關資訊。預設圖片標籤模型可辨識一般物件、地點、活動、動物物種和產品等內容。
您也可以使用自訂圖片分類模型,根據特定用途調整偵測功能。詳情請參閱「使用自訂 LiteRT 模型」。
主要功能
- 強大的通用基礎分類器 可辨識超過 400 個類別,描述相片中最常見的物件。
- 使用自訂模型,根據您的用途調整 使用 TensorFlow Hub 中的其他預先訓練模型,或是使用 TensorFlow、AutoML 或 LiteRT 訓練的自訂模型。
- 簡單易用的高階 API 不必處理低階模型輸入/輸出、圖片預先處理和後續處理,也不用建構處理管道。ML Kit 會從 LiteRT 模型擷取標籤,並以文字說明的形式提供。
請注意,這個 API 適用於描述完整圖片的圖片分類模型。如要分類圖片中的一或多個物件 (例如鞋子或家具),物件偵測與追蹤 API 可能更適合。
支援的圖片分類模型
圖像標籤 API 支援不同的圖像分類模型:
| 支援的圖片分類模型 | |
|---|---|
| 基礎模型 | 根據預設,API 會使用功能強大的一般用途圖片標籤模型,可辨識超過 400 個實體,涵蓋相片中最常見的概念。 |
| 自訂 LiteRT 模型 | 如要鎖定特定應用程式的概念,API 可接受來自各種來源的自訂圖像分類模型。這些模型可以是從 TensorFlow Hub 下載的預先訓練模型,也可以是您使用 AutoML、LiteRT 或 TensorFlow 本身訓練的模型。模型可以與應用程式一併封裝,也可以透過 Cloud Storage 代管,並在執行階段下載。 |
使用基礎模型
ML Kit 的基礎模型會傳回實體清單,識別人物、事物、地點、活動等。每個實體都有一個分數,代表機器學習模型對實體相關性的信心程度。有了這項資訊,您就能執行自動產生中繼資料和內容審查等工作。ML Kit 提供的預設模型可辨識超過 400 種不同的實體。
標籤範例
圖片標籤 API 中的基礎模型支援 400 多個標籤,例如:
| 類別 | 標籤範例 |
|---|---|
| 人物 | CrowdSelfieSmile |
| 活動 | DancingEatingSurfing |
| 事物 | CarPianoReceipt |
| 動物 | BirdCatDog |
| 植物 | FlowerFruitVegetable |
| 地點 | BeachLakeMountain |
搜尋結果範例
以下是隨附相片中辨識出的實體範例。
| 標籤 0 | |
|---|---|
| Text | 體育場館 |
| 提升信心 | 0.9205354 |
| 標籤 1 | |
| Text | 運動 |
| 提升信心 | 0.7531109 |
| 標籤 2 | |
| Text | 事件 |
| 提升信心 | 0.66905296 |
| 標籤 3 | |
| Text | 休閒 |
| 提升信心 | 0.59904146 |
| 標籤 4 | |
| Text | 足球 |
| 提升信心 | 0.56384534 |
| 標籤 5 | |
| Text | 淨收益 |
| 提升信心 | 0.54679185 |
| 標籤 6 | |
| Text | 植物 |
| 提升信心 | 0.524364 |
使用自訂 LiteRT 模型
ML Kit 的基礎圖像標籤模型是為一般用途而建構。這項模型經過訓練,可辨識 400 個類別,描述相片中最常見的物件。您的應用程式可能需要專門的圖片分類模型,以便更詳細地辨識較少數量的類別,例如區分花卉品種或食物類型的模型。
這項 API 支援來自各種來源的自訂圖片分類模型,可讓您根據特定用途進行調整。詳情請參閱「使用 ML Kit 的自訂模型」。自訂模型可與應用程式一併封裝,或從 Cloud Storage 動態下載。
輸入圖片預處理
如有需要,圖片標記會使用雙線性圖片縮放和延展功能,調整輸入圖片的大小和顯示比例,以符合基礎模型的需求。