Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

画像ラベル付け

ML Kit の画像ラベル付け API を使用すると、画像内のエンティティについての情報を、幅広いカテゴリにわたって検出、抽出できます。デフォルトの画像ラベル付けモデルでは、一般的な物体、場所、活動、動物の種類、商品などを識別できます。

カスタム画像分類モデルを使用して、特定のユースケースに合わせて検出を調整することもできます。詳細については、カスタム LiteRT モデルを使用するをご覧ください。

主な機能

強力な汎用ベース分類子 写真で最も一般的なオブジェクトを説明する 400 以上のカテゴリを認識します。
カスタムモデルでユースケースに合わせて調整する TensorFlow Hub の他の事前トレーニング済みモデル、または TensorFlow、AutoML、LiteRT でトレーニングした独自のカスタムモデルを使用します。
使いやすい高レベル API 低レベルのモデルの入出力、画像の前処理と後処理、処理パイプラインの構築を行う必要はありません。ML Kit は LiteRT モデルからラベルを抽出し、テキストの説明として提供します。

この API は、画像全体を説明する画像分類モデルを対象としています。靴や家具など、画像内の 1 つ以上のオブジェクトを分類する場合は、オブジェクトの検出とトラッキング API の方が適している可能性があります。

サポートされている画像分類モデル

Image Labeling API は、さまざまな画像分類モデルをサポートしています。

サポートされている画像分類モデル
ベースモデル	デフォルトでは、API は強力な汎用画像ラベル付けモデルを使用します。このモデルは、写真で最も一般的に見られるコンセプトに対応する 400 以上のエンティティを認識します。
カスタム LiteRT モデル	アプリ固有のコンセプトをターゲットにするため、API は幅広いソースのカスタム画像分類モデルを受け入れます。これらは、TensorFlow Hub からダウンロードされた事前トレーニング済みモデルや、AutoML、LiteRT、TensorFlow 自体でトレーニングされた独自のモデルです。モデルは、アプリにバンドルすることも、Cloud Storage でホストして実行時にダウンロードすることもできます。

サポートされている画像分類モデル

ベースモデル

デフォルトでは、API は強力な汎用画像ラベル付けモデルを使用します。このモデルは、写真で最も一般的に見られるコンセプトに対応する 400 以上のエンティティを認識します。

カスタム LiteRT モデル

アプリ固有のコンセプトをターゲットにするため、API は幅広いソースのカスタム画像分類モデルを受け入れます。これらは、TensorFlow Hub からダウンロードされた事前トレーニング済みモデルや、AutoML、LiteRT、TensorFlow 自体でトレーニングされた独自のモデルです。モデルは、アプリにバンドルすることも、Cloud Storage でホストして実行時にダウンロードすることもできます。

ベースモデルの使用

ML Kit のベースモデルは、人物、物、場所、アクティビティなどを識別するエンティティのリストを返します。各エンティティには、ML モデルの関連性に対する信頼度を示すスコアが付いています。この情報を使用して、メタデータの自動生成やコンテンツの管理などのタスクを実行できます。ML Kit に付属のデフォルトモデルは、400 種類以上のエンティティを認識します。

iOS Android

ラベルの例

Image Labeling API のベースモデルでは、次のように 400 以上のラベルがサポートされます。

カテゴリ	ラベルの例
ユーザー	`Crowd` `Selfie` `Smile`
アクティビティ	`Dancing` `Eating` `Surfing`
被写体	`Car` `Piano` `Receipt`
動物	`Bird` `Cat` `Dog`
植物	`Flower` `Fruit` `Vegetable`
場所	`Beach` `Lake` `Mountain`

検索結果の例

添付の写真で認識されたエンティティの例を次に示します。

写真: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0

ラベル 0
テキスト	スタジアム
信頼度	0.9205354
ラベル 1
テキスト	スポーツ
信頼度	0.7531109
ラベル 2
テキスト	イベント
信頼度	0.66905296
ラベル 3
テキスト	レジャー
信頼度	0.59904146
ラベル 4
テキスト	サッカー
信頼度	0.56384534
ラベル 5
テキスト	ネット
信頼度	0.54679185
ラベル 6
テキスト	植物
信頼度	0.524364

カスタム LiteRT モデルを使用する

ML Kit の基本的な画像ラベル付けモデルは、汎用的な使用のために構築されています。写真で最も一般的なオブジェクトを説明する 400 のカテゴリを認識するようにトレーニングされています。アプリで、花の種類や食品の種類を区別するモデルなど、より狭い範囲のカテゴリを詳細に認識する特殊な画像分類モデルが必要になることがあります。

この API を使用すると、さまざまなソースのカスタム画像分類モデルをサポートすることで、特定のユースケースに合わせて調整できます。詳細については、ML Kit を使用したカスタムモデルを参照してください。カスタムモデルは、アプリにバンドルすることも、Cloud Storage から動的にダウンロードすることもできます。

iOS Android

入力画像の前処理

必要に応じて、画像ラベリングはバイリニア画像のスケーリングとストレッチを使用して、入力画像のサイズとアスペクト比を調整し、基盤となるモデルの要件に適合させます。

画像ラベル付け コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

主な機能

サポートされている画像分類モデル

ベースモデルの使用

ラベルの例

検索結果の例

カスタム LiteRT モデルを使用する

入力画像の前処理

画像ラベル付け