객체 감지 및 추적

ML Kit의 기기별 객체 감지 및 추적 API를 사용하면 이미지 또는 실시간 카메라 피드에서 객체를 감지하고 추적할 수 있습니다.

원하는 경우 API에 내장된 대략적인 분류기를 사용하거나 자체 맞춤 이미지 분류 모델을 사용하여 감지된 객체를 분류할 수 있습니다. 자세한 내용은 맞춤 LiteRT 모델 사용을 참고하세요.

객체 감지 및 추적은 기기에서 이루어지므로 시각적 검색 파이프라인의 프런트엔드로서도 잘 작동합니다. 객체를 감지하고 필터링한 후 Cloud Vision 제품 검색과 같은 클라우드 백엔드로 전달할 수 있습니다.

iOS Android

주요 기능

  • 빠른 객체 감지 및 추적 객체를 감지하고 이미지에서 객체 위치를 확인합니다. 연속 이미지 프레임에서 객체를 추적합니다.
  • 최적화된 온디바이스 모델 객체 감지 및 추적 모델은 휴대기기에 최적화되어 있으며 보급형 기기에서도 실시간 애플리케이션에서 사용하도록 설계되어 있습니다.
  • 눈에 띄는 객체 감지 이미지에서 가장 눈에 띄는 객체를 자동으로 감지합니다.
  • 대략적인 분류 객체를 광범위한 카테고리로 분류하여 관심 없는 객체를 필터링할 수 있습니다. 가정용품, 의류, 식품, 식물, 장소 카테고리가 지원됩니다.
  • 커스텀 모델을 사용한 분류 자체 커스텀 이미지 분류 모델을 사용하여 특정 객체 카테고리를 식별하거나 필터링합니다. 이미지의 배경을 제외하여 맞춤 모델의 성능을 개선하세요.

결과 예시

여러 이미지에서 가장 뚜렷한 객체 추적

다음 예에서는 ML Kit에서 제공하는 기본 대략적인 분류기를 사용하여 연속된 세 프레임의 추적 데이터를 보여줍니다.

추적 ID 0
경계 (95, 45), (496, 45), (496, 240), (95, 240)
카테고리 장소
분류 신뢰도 0.9296875
추적 ID 0
경계 (84, 46), (478, 46), (478, 247), (84, 247)
카테고리 장소
분류 신뢰도 0.8710938
추적 ID 0
경계 (53, 45), (519, 45), (519, 240), (53, 240)
카테고리 장소
분류 신뢰도 0.8828125

사진: Christian Ferrer [CC BY-SA 4.0]

정적 이미지의 여러 객체

다음 예시에서는 ML Kit에서 제공하는 기본 대략적인 분류기로 이미지에서 감지된 네 개의 객체에 관한 데이터를 보여줍니다.

신발

객체 0
경계 (1, 97), (332, 97), (332, 332), (1, 332)
카테고리 FASHION_GOOD
분류 신뢰도 0.95703125
객체 1
경계 (186, 80), (337, 80), (337, 226), (186, 226)
카테고리 FASHION_GOOD
분류 신뢰도 0.84375
Object 2
경계 (296, 80), (472, 80), (472, 388), (296, 388)
카테고리 FASHION_GOOD
분류 신뢰도 0.94921875
Object 3
경계 (439, 83), (615, 83), (615, 306), (439, 306)
카테고리 FASHION_GOOD
분류 신뢰도 0.9375

맞춤 LiteRT 모델 사용

기본 대략적 분류기는 5개 카테고리에 맞게 빌드되어 감지된 객체에 관한 정보가 제한적입니다. 꽃의 품종이나 음식 종류를 구분하는 모델과 같이 더 구체적인 개념 영역을 자세히 다루는 전문화된 분류기 모델이 필요할 수 있습니다.

이 API를 사용하면 다양한 소스의 맞춤 이미지 분류 모델을 지원하여 특정 사용 사례에 맞게 조정할 수 있습니다. 자세한 내용은 ML Kit을 사용한 맞춤 모델을 참고하세요. 맞춤 모델은 앱과 함께 번들로 묶거나 Cloud Storage에서 동적으로 다운로드할 수 있습니다.

iOS Android

입력 이미지 전처리

필요한 경우 객체 감지 및 추적은 이중 선형 이미지 크기 조절 및 늘리기를 사용하여 기본 모델의 요구사항에 맞게 입력 이미지 크기와 가로세로 비율을 조정합니다.