
ML Kit의 이미지 라벨 지정 API를 사용하면 광범위한 카테고리에서 이미지 내 항목에 대한 정보를 감지하고 추출할 수 있습니다. 기본 이미지 라벨 지정 모델은 일반 객체, 장소, 활동, 동물 종, 제품 등을 식별할 수 있습니다.
맞춤 이미지 분류 모델을 사용하여 특정 사용 사례에 맞게 감지를 조정할 수도 있습니다. 자세한 내용은 맞춤 LiteRT 모델 사용을 참고하세요.
주요 기능
- 강력한 범용 기본 분류기 사진에서 가장 흔하게 발견되는 객체를 설명하는 400개 이상의 카테고리를 인식합니다.
- 맞춤 모델로 사용 사례에 맞게 조정 TensorFlow Hub의 다른 사전 학습된 모델이나 TensorFlow, AutoML 또는 LiteRT로 학습된 자체 맞춤 모델을 사용하세요.
- 사용하기 쉬운 상위 수준 API 하위 수준 모델 입력/출력, 이미지 사전 처리 및 사후 처리, 처리 파이프라인 빌드를 처리할 필요가 없습니다. ML Kit는 LiteRT 모델에서 라벨을 추출하여 텍스트 설명으로 제공합니다.
이 API는 전체 이미지를 설명하는 이미지 분류 모델을 위한 것입니다. 신발이나 가구와 같은 이미지의 하나 이상의 객체를 분류하는 경우 객체 감지 및 추적 API가 더 적합할 수 있습니다.
지원되는 이미지 분류 모델
이미지 라벨 지정 API는 다양한 이미지 분류 모델을 지원합니다.
| 지원되는 이미지 분류 모델 | |
|---|---|
| 기본 모델 | 기본적으로 API는 사진에서 가장 흔하게 등장하는 개념을 포괄하는 400개 이상의 항목을 인식하는 강력한 범용 이미지 라벨 지정 모델을 사용합니다. |
| 맞춤 LiteRT 모델 | 애플리케이션별 개념을 타겟팅하기 위해 API는 다양한 소스의 맞춤 이미지 분류 모델을 허용합니다. TensorFlow Hub에서 다운로드한 사전 학습된 모델이거나 AutoML, LiteRT 또는 TensorFlow 자체로 학습시킨 자체 모델일 수 있습니다. 모델을 앱과 번들로 묶거나 Cloud Storage로 호스팅하고 런타임에 다운로드할 수 있습니다. |
기본 모델 사용
ML Kit의 기본 모델은 사람, 사물, 장소, 활동 등을 식별하는 항목 목록을 반환합니다. 각 항목에는 ML 모델의 관련성을 나타내는 신뢰도 점수가 표시됩니다. 이 정보를 근거로 자동 메타데이터 생성 및 콘텐츠 검토 등의 태스크를 수행할 수 있습니다. ML Kit에 제공된 기본 모델은 400개가 넘는 다양한 항목을 인식합니다.
라벨 예시
이미지 라벨 지정 API의 기본 모델은 다음 예시와 같은 400개 이상의 라벨을 지원합니다.
| 카테고리 | 라벨 예시 |
|---|---|
| 사용자 | CrowdSelfieSmile |
| 활동 | DancingEatingSurfing |
| 사물 | CarPianoReceipt |
| 동물 | BirdCatDog |
| 식물 | FlowerFruitVegetable |
| 장소 | BeachLakeMountain |
결과 예시
다음은 함께 제공된 사진에서 인식된 항목의 예입니다.
| 라벨 0 | |
|---|---|
| 텍스트 | 경기장 |
| 신뢰 수준 | 0.9205354 |
| 라벨 1 | |
| 텍스트 | 스포츠 |
| 신뢰 수준 | 0.7531109 |
| 라벨 2 | |
| 텍스트 | 이벤트 |
| 신뢰 수준 | 0.66905296 |
| 라벨 3 | |
| 텍스트 | 레저 |
| 신뢰 수준 | 0.59904146 |
| 라벨 4 | |
| 텍스트 | 축구 |
| 신뢰 수준 | 0.56384534 |
| 라벨 5 | |
| 텍스트 | 순 통계 |
| 신뢰 수준 | 0.54679185 |
| 라벨 6 | |
| 텍스트 | 식물 |
| 신뢰 수준 | 0.524364 |
맞춤 LiteRT 모델 사용
ML Kit의 기본 이미지 라벨 지정 모델은 범용으로 구축되었으며, 사진에서 가장 흔하게 등장하는 객체를 설명하는 400개의 카테고리를 인식하도록 학습되었습니다. 앱에 꽃의 품종이나 음식 종류를 구분하는 모델과 같이 더 좁은 범위의 카테고리를 자세히 인식하는 전문화된 이미지 분류 모델이 필요할 수 있습니다.
이 API를 사용하면 다양한 소스의 맞춤 이미지 분류 모델을 지원하여 특정 사용 사례에 맞게 조정할 수 있습니다. 자세한 내용은 ML Kit을 사용한 맞춤 모델을 참고하세요. 맞춤 모델은 앱과 함께 번들로 묶거나 Cloud Storage에서 동적으로 다운로드할 수 있습니다.
입력 이미지 전처리
필요한 경우 이미지 라벨링은 이중 선형 이미지 크기 조절 및 스트레칭을 사용하여 기본 모델의 요구사항에 맞게 입력 이미지 크기와 가로세로 비율을 조정합니다.