텍스트 인식 v2

ML Kit 텍스트 인식 v2 API는 한국어, 중국어, 데바나가리 문자, 일본어, 라틴 문자 집합으로 된 텍스트를 인식할 수 있습니다. 또한 신용카드, 영수증, 명함 처리와 같은 데이터 입력 작업을 자동화하는 데도 API를 사용할 수 있습니다.

iOS Android

주요 기능

  • 다양한 스크립트 및 언어에서 텍스트 인식 한국어, 중국어, 데바나가리 문자, 일본어, 라틴 자모로 작성된 텍스트 인식을 지원합니다.
  • 텍스트 구조 분석 기호, 요소, 줄, 단락 감지 지원
  • 텍스트 언어 식별 인식된 텍스트의 언어를 식별합니다.
  • 실시간 인식 다양한 기기에서 실시간으로 텍스트를 인식할 수 있습니다.

텍스트 구조

텍스트 인식기는 텍스트를 블록, 선, 요소 및 기호로 분류합니다. 대략적으로 말씀드리면 다음과 같습니다.

  • 블록은 단락이나 열과 같은 연속된 텍스트 줄 집합입니다.

  • 은 같은 축에 있는 연속된 단어 집합입니다.

  • 요소는 대부분의 라틴 언어에서 같은 축에 있는 연속된 영숫자 문자 ('단어') 또는 다른 단어의 단어입니다.

  • Symbol은 대부분의 라틴어 계열 언어에서 같은 축에 있는 단일 영숫자 문자 또는 다른 문자입니다.

아래 이미지는 이러한 각 예시를 내림차순으로 보여줍니다. 첫 번째로 강조표시된 청록색 블록은 텍스트 블록입니다. 두 번째 강조표시된 블록 세트(파란색)는 텍스트 줄입니다. 마지막으로 진한 파란색으로 강조표시된 세 번째 블록 세트는 단어입니다.

API는 감지된 모든 블록, 선, 요소, 기호에 대해 경계 상자, 모서리점, 회전 정보, 신뢰도 점수, 인식된 언어, 인식된 텍스트를 반환합니다.

결과 예시


사진: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
인식된 텍스트
텍스트 Wege
der parlamentarischen
Demokratie
블록 (블록 1개)
블록 0
텍스트 민주주의 의의회
프레임 (296, 665~796, 882)
코너 포인트 (296, 719), (778, 665), (796, 828), (314, 882)
인식된 언어 코드 de
노선 (3줄)
입력란 0
텍스트 베게 데르
프레임 (434, 678~670, 749)
코너 포인트 (434, 705), (665, 678), (670, 722), (439, 749)
인식된 언어 코드 de
신뢰도 점수 0.8766741
회전 각도 -6.6116457
요소 (2개 요소)
요소 0
텍스트 베게
프레임 (434, 689~575, 749)
코너 포인트 (434, 705), (570, 689), (575, 733), (439, 749)
인식된 언어 코드 de
신뢰도 점수 0.8964844
회전 각도 -6.6116457
요소 (4개 요소)
기호 0
텍스트 W
프레임 (434, 698~500, 749)
코너 포인트 (434, 706), (495, 698), (500, 741), (439, 749)
신뢰도 점수 0.87109375
회전 각도 -6.611646