
ML Kit 텍스트 인식 v2 API는 한국어, 중국어, 데바나가리 문자, 일본어, 라틴 문자 집합으로 된 텍스트를 인식할 수 있습니다. 또한 신용카드, 영수증, 명함 처리와 같은 데이터 입력 작업을 자동화하는 데도 API를 사용할 수 있습니다.
주요 기능
- 다양한 스크립트 및 언어에서 텍스트 인식 한국어, 중국어, 데바나가리 문자, 일본어, 라틴 자모로 작성된 텍스트 인식을 지원합니다.
- 텍스트 구조 분석 기호, 요소, 줄, 단락 감지 지원
- 텍스트 언어 식별 인식된 텍스트의 언어를 식별합니다.
- 실시간 인식 다양한 기기에서 실시간으로 텍스트를 인식할 수 있습니다.
텍스트 구조
텍스트 인식기는 텍스트를 블록, 선, 요소 및 기호로 분류합니다. 대략적으로 말씀드리면 다음과 같습니다.
- 블록은 단락이나 열과 같은 연속된 텍스트 줄 집합입니다. 
- 행은 같은 축에 있는 연속된 단어 집합입니다. 
- 요소는 대부분의 라틴 언어에서 같은 축에 있는 연속된 영숫자 문자 ('단어') 또는 다른 단어의 단어입니다. 
- Symbol은 대부분의 라틴어 계열 언어에서 같은 축에 있는 단일 영숫자 문자 또는 다른 문자입니다. 
아래 이미지는 이러한 각 예시를 내림차순으로 보여줍니다. 첫 번째로 강조표시된 청록색 블록은 텍스트 블록입니다. 두 번째 강조표시된 블록 세트(파란색)는 텍스트 줄입니다. 마지막으로 진한 파란색으로 강조표시된 세 번째 블록 세트는 단어입니다.

API는 감지된 모든 블록, 선, 요소, 기호에 대해 경계 상자, 모서리점, 회전 정보, 신뢰도 점수, 인식된 언어, 인식된 텍스트를 반환합니다.
결과 예시

사진: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
| 인식된 텍스트 | |
|---|---|
| 텍스트 | Wege der parlamentarischen Demokratie | 
| 블록 | (블록 1개) | 
| 블록 0 | |
|---|---|
| 텍스트 | 민주주의 의의회 | 
| 프레임 | (296, 665~796, 882) | 
| 코너 포인트 | (296, 719), (778, 665), (796, 828), (314, 882) | 
| 인식된 언어 코드 | de | 
| 노선 | (3줄) | 
| 입력란 0 | |
|---|---|
| 텍스트 | 베게 데르 | 
| 프레임 | (434, 678~670, 749) | 
| 코너 포인트 | (434, 705), (665, 678), (670, 722), (439, 749) | 
| 인식된 언어 코드 | de | 
| 신뢰도 점수 | 0.8766741 | 
| 회전 각도 | -6.6116457 | 
| 요소 | (2개 요소) | 
| 요소 0 | |
|---|---|
| 텍스트 | 베게 | 
| 프레임 | (434, 689~575, 749) | 
| 코너 포인트 | (434, 705), (570, 689), (575, 733), (439, 749) | 
| 인식된 언어 코드 | de | 
| 신뢰도 점수 | 0.8964844 | 
| 회전 각도 | -6.6116457 | 
| 요소 | (4개 요소) | 
| 기호 0 | |
|---|---|
| 텍스트 | W | 
| 프레임 | (434, 698~500, 749) | 
| 코너 포인트 | (434, 706), (495, 698), (500, 741), (439, 749) | 
| 신뢰도 점수 | 0.87109375 | 
| 회전 각도 | -6.611646 | 
