ML Kit 텍스트 인식 v2 API는 한국어, 중국어, 데바나가리 문자, 일본어, 라틴 문자 집합으로 된 텍스트를 인식할 수 있습니다. 또한 신용카드, 영수증, 명함 처리와 같은 데이터 입력 작업을 자동화하는 데도 API를 사용할 수 있습니다.
주요 기능
- 다양한 스크립트 및 언어에서 텍스트 인식 한국어, 중국어, 데바나가리 문자, 일본어, 라틴 자모로 작성된 텍스트 인식을 지원합니다.
- 텍스트 구조 분석 기호, 요소, 줄, 단락 감지 지원
- 텍스트 언어 식별 인식된 텍스트의 언어를 식별합니다.
- 실시간 인식 다양한 기기에서 실시간으로 텍스트를 인식할 수 있습니다.
텍스트 구조
텍스트 인식기는 텍스트를 블록, 선, 요소 및 기호로 분류합니다. 대략적으로 말씀드리면 다음과 같습니다.
블록은 단락이나 열과 같은 연속된 텍스트 줄 집합입니다.
행은 같은 축에 있는 연속된 단어 집합입니다.
요소는 대부분의 라틴 언어에서 같은 축에 있는 연속된 영숫자 문자 ('단어') 또는 다른 단어의 단어입니다.
Symbol은 대부분의 라틴어 계열 언어에서 같은 축에 있는 단일 영숫자 문자 또는 다른 문자입니다.
아래 이미지는 이러한 각 예시를 내림차순으로 보여줍니다. 첫 번째로 강조표시된 청록색 블록은 텍스트 블록입니다. 두 번째 강조표시된 블록 세트(파란색)는 텍스트 줄입니다. 마지막으로 진한 파란색으로 강조표시된 세 번째 블록 세트는 단어입니다.
API는 감지된 모든 블록, 선, 요소, 기호에 대해 경계 상자, 모서리점, 회전 정보, 신뢰도 점수, 인식된 언어, 인식된 텍스트를 반환합니다.
결과 예시
인식된 텍스트 | |
---|---|
텍스트 | Wege der parlamentarischen Demokratie |
블록 | (블록 1개) |
블록 0 | |
---|---|
텍스트 | 민주주의 의의회 |
프레임 | (296, 665~796, 882) |
코너 포인트 | (296, 719), (778, 665), (796, 828), (314, 882) |
인식된 언어 코드 | de |
노선 | (3줄) |
입력란 0 | |
---|---|
텍스트 | 베게 데르 |
프레임 | (434, 678~670, 749) |
코너 포인트 | (434, 705), (665, 678), (670, 722), (439, 749) |
인식된 언어 코드 | de |
신뢰도 점수 | 0.8766741 |
회전 각도 | -6.6116457 |
요소 | (2개 요소) |
요소 0 | |
---|---|
텍스트 | 베게 |
프레임 | (434, 689~575, 749) |
코너 포인트 | (434, 705), (570, 689), (575, 733), (439, 749) |
인식된 언어 코드 | de |
신뢰도 점수 | 0.8964844 |
회전 각도 | -6.6116457 |
요소 | (4개 요소) |
기호 0 | |
---|---|
텍스트 | W |
프레임 | (434, 698~500, 749) |
코너 포인트 | (434, 706), (495, 698), (500, 741), (439, 749) |
신뢰도 점수 | 0.87109375 |
회전 각도 | -6.611646 |