Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

圖片標籤

您可以使用 ML Kit 的圖片標籤 API，偵測及擷取圖片中廣泛類別的實體相關資訊。預設圖片標籤模型可辨識一般物件、地點、活動、動物物種和產品等內容。

您也可以使用自訂圖片分類模型，根據特定用途調整偵測功能。詳情請參閱「使用自訂 LiteRT 模型」。

主要功能

強大的通用基礎分類器 可辨識超過 400 個類別，描述相片中最常見的物件。
使用自訂模型，根據您的用途調整 使用 TensorFlow Hub 中的其他預先訓練模型，或是使用 TensorFlow、AutoML 或 LiteRT 訓練的自訂模型。
簡單易用的高階 API 不必處理低階模型輸入/輸出、圖片預先處理和後續處理，也不用建構處理管道。ML Kit 會從 LiteRT 模型擷取標籤，並以文字說明的形式提供。

請注意，這個 API 適用於描述完整圖片的圖片分類模型。如要分類圖片中的一或多個物件 (例如鞋子或家具)，物件偵測與追蹤 API 可能更適合。

圖像標籤 API 支援不同的圖像分類模型：

支援的圖片分類模型
基礎模型	根據預設，API 會使用功能強大的一般用途圖片標籤模型，可辨識超過 400 個實體，涵蓋相片中最常見的概念。
自訂 LiteRT 模型	如要鎖定特定應用程式的概念，API 可接受來自各種來源的自訂圖像分類模型。這些模型可以是從 TensorFlow Hub 下載的預先訓練模型，也可以是您使用 AutoML、LiteRT 或 TensorFlow 本身訓練的模型。模型可以與應用程式一併封裝，也可以透過 Cloud Storage 代管，並在執行階段下載。

ML Kit 的基礎模型會傳回實體清單，識別人物、事物、地點、活動等。每個實體都有一個分數，代表機器學習模型對實體相關性的信心程度。有了這項資訊，您就能執行自動產生中繼資料和內容審查等工作。ML Kit 提供的預設模型可辨識超過 400 種不同的實體。

圖片標籤 API 中的基礎模型支援 400 多個標籤，例如：

以下是隨附相片中辨識出的實體範例。

ML Kit 的基礎圖像標籤模型是為一般用途而建構。這項模型經過訓練，可辨識 400 個類別，描述相片中最常見的物件。您的應用程式可能需要專門的圖片分類模型，以便更詳細地辨識較少數量的類別，例如區分花卉品種或食物類型的模型。

這項 API 支援來自各種來源的自訂圖片分類模型，可讓您根據特定用途進行調整。詳情請參閱「使用 ML Kit 的自訂模型」。自訂模型可與應用程式一併封裝，或從 Cloud Storage 動態下載。

如有需要，圖片標記會使用雙線性圖片縮放和延展功能，調整輸入圖片的大小和顯示比例，以符合基礎模型的需求。