이미지 라벨 지정

ML Kit의 이미지 라벨 지정 API를 사용하면 광범위한 카테고리에서 이미지 내 항목에 대한 정보를 감지하고 추출할 수 있습니다. 기본 이미지 라벨 지정 모델은 일반 객체, 장소, 활동, 동물 종, 제품 등을 식별할 수 있습니다.

맞춤 이미지 분류 모델을 사용하여 특정 사용 사례에 맞게 감지를 조정할 수도 있습니다. 자세한 내용은 맞춤 LiteRT 모델 사용을 참고하세요.

주요 기능

  • 강력한 범용 기본 분류기 사진에서 가장 흔하게 발견되는 객체를 설명하는 400개 이상의 카테고리를 인식합니다.
  • 맞춤 모델로 사용 사례에 맞게 조정 TensorFlow Hub의 다른 사전 학습된 모델이나 TensorFlow, AutoML 또는 LiteRT로 학습된 자체 맞춤 모델을 사용하세요.
  • 사용하기 쉬운 상위 수준 API 하위 수준 모델 입력/출력, 이미지 사전 처리 및 사후 처리, 처리 파이프라인 빌드를 처리할 필요가 없습니다. ML Kit는 LiteRT 모델에서 라벨을 추출하여 텍스트 설명으로 제공합니다.

이 API는 전체 이미지를 설명하는 이미지 분류 모델을 위한 것입니다. 신발이나 가구와 같은 이미지의 하나 이상의 객체를 분류하는 경우 객체 감지 및 추적 API가 더 적합할 수 있습니다.

지원되는 이미지 분류 모델

이미지 라벨 지정 API는 다양한 이미지 분류 모델을 지원합니다.

지원되는 이미지 분류 모델
기본 모델 기본적으로 API는 사진에서 가장 흔하게 등장하는 개념을 포괄하는 400개 이상의 항목을 인식하는 강력한 범용 이미지 라벨 지정 모델을 사용합니다.
맞춤 LiteRT 모델 애플리케이션별 개념을 타겟팅하기 위해 API는 다양한 소스의 맞춤 이미지 분류 모델을 허용합니다. TensorFlow Hub에서 다운로드한 사전 학습된 모델이거나 AutoML, LiteRT 또는 TensorFlow 자체로 학습시킨 자체 모델일 수 있습니다. 모델을 앱과 번들로 묶거나 Cloud Storage로 호스팅하고 런타임에 다운로드할 수 있습니다.

기본 모델 사용

ML Kit의 기본 모델은 사람, 사물, 장소, 활동 등을 식별하는 항목 목록을 반환합니다. 각 항목에는 ML 모델의 관련성을 나타내는 신뢰도 점수가 표시됩니다. 이 정보를 근거로 자동 메타데이터 생성 및 콘텐츠 검토 등의 태스크를 수행할 수 있습니다. ML Kit에 제공된 기본 모델은 400개가 넘는 다양한 항목을 인식합니다.

iOS Android

라벨 예시

이미지 라벨 지정 API의 기본 모델은 다음 예시와 같은 400개 이상의 라벨을 지원합니다.

카테고리라벨 예시
사용자 Crowd
Selfie
Smile
활동 Dancing
Eating
Surfing
사물 Car
Piano
Receipt
동물 Bird
Cat
Dog
식물 Flower
Fruit
Vegetable
장소 Beach
Lake
Mountain

결과 예시

다음은 함께 제공된 사진에서 인식된 항목의 예입니다.

사진: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
라벨 0
텍스트 경기장
신뢰 수준 0.9205354
라벨 1
텍스트 스포츠
신뢰 수준 0.7531109
라벨 2
텍스트 이벤트
신뢰 수준 0.66905296
라벨 3
텍스트 레저
신뢰 수준 0.59904146
라벨 4
텍스트 축구
신뢰 수준 0.56384534
라벨 5
텍스트 순 통계
신뢰 수준 0.54679185
라벨 6
텍스트 식물
신뢰 수준 0.524364

맞춤 LiteRT 모델 사용

ML Kit의 기본 이미지 라벨 지정 모델은 범용으로 구축되었으며, 사진에서 가장 흔하게 등장하는 객체를 설명하는 400개의 카테고리를 인식하도록 학습되었습니다. 앱에 꽃의 품종이나 음식 종류를 구분하는 모델과 같이 더 좁은 범위의 카테고리를 자세히 인식하는 전문화된 이미지 분류 모델이 필요할 수 있습니다.

이 API를 사용하면 다양한 소스의 맞춤 이미지 분류 모델을 지원하여 특정 사용 사례에 맞게 조정할 수 있습니다. 자세한 내용은 ML Kit을 사용한 맞춤 모델을 참고하세요. 맞춤 모델은 앱과 함께 번들로 묶거나 Cloud Storage에서 동적으로 다운로드할 수 있습니다.

iOS Android

입력 이미지 전처리

필요한 경우 이미지 라벨링은 이중 선형 이미지 크기 조절 및 스트레칭을 사용하여 기본 모델의 요구사항에 맞게 입력 이미지 크기와 가로세로 비율을 조정합니다.