A API Text Recognition v2 do Kit de ML pode reconhecer texto em qualquer conjunto de caracteres em chinês, devanágari, japonês, coreano e latino. A API também pode ser usada para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.
Principais recursos
- Reconhecer texto em vários scripts e idiomas: permite o reconhecimento de textos em chinês, devanágari, japonês, coreano e latino
- Analisa a estrutura do texto: oferece suporte à detecção de símbolos, elementos, linhas e parágrafos.
- Identificar idioma do texto Identifica o idioma do texto reconhecido
- Reconhecimento em tempo real: pode reconhecer texto em tempo real em uma grande variedade de dispositivos.
Estrutura do texto
O Reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Em termos gerais:
um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou coluna,
uma Linha é um conjunto contíguo de palavras no mesmo eixo, e
um Elemento é um conjunto contíguo de caracteres alfanuméricos ("palavra") no mesmo eixo na maioria dos idiomas latinos ou uma palavra nos outros.
um Símbolo é um caractere alfanumérico único no mesmo eixo na maioria dos idiomas latinos ou um caractere nos outros.
A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Finalmente, o terceiro conjunto de blocos destacados, em azul-escuro, são as Palavras.
Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, os cantos, as informações de rotação, a pontuação de confiança, os idiomas reconhecidos e o texto reconhecido.
Resultados de exemplo
Texto reconhecido | |
---|---|
Texto | Wege der parlamentarischen Democratie |
Blocks | (1 bloco) |
Bloco 0 | |
---|---|
Texto | Wege der Parlamentarischen Demokratie |
Quadro | (296, 665 a 796, 882) |
Pontos de canto | (296, 719), (778, 665), (796, 828), (314, 882) |
Código de idioma reconhecido | de |
linhas; | (3 linhas) |
Linha 0 | |
---|---|
Texto | Wege der |
Quadro | (434, 678 a 670, 749) |
Pontos de canto | (434, 705), (665, 678), (670, 722), (439, 749) |
Código de idioma reconhecido | de |
Pontuação de confiança | 0,8766741 |
Grau de rotação | -6,6116457 |
Elementos | (2 elementos) |
Elemento 0 | |
---|---|
Texto | Wege |
Quadro | (434, 689 a 575, 749) |
Pontos de canto | (434, 705), (570, 689), (575, 733), (439, 749) |
Código de idioma reconhecido | de |
Pontuação de confiança | 0,8964844 |
Grau de rotação | -6,6116457 |
Elementos | (4 elementos) |
Símbolo 0 | |
---|---|
Texto | W |
Quadro | (434.698 a 500.749) |
Pontos de canto | (434, 706), (495, 698), (500, 741), (439, 749) |
Pontuação de confiança | 0,87109375 |
Grau de rotação | -6,611646 |