Reconocimiento de texto

Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

La API de reconocimiento de texto del Kit de AA puede reconocer texto en cualquier grupo de caracteres latino. También se puede usar para automatizar tareas de entrada de datos, como el procesamiento de tarjetas de crédito, recibos y tarjetas de presentación.

iOS Android

Funciones clave

  • Reconoce texto en idiomas latinos Admite el reconocimiento de texto con alfabeto latino.
  • Analizar la estructura del texto Admite la detección de palabras/elementos, líneas y párrafos
  • Identificar el idioma del texto Identifica el idioma del texto reconocido.
  • Tamaño de aplicación pequeño En Android, la API se ofrece como una biblioteca desagrupada a través de los Servicios de Google Play
  • Reconocimiento en tiempo real: permite reconocer texto en tiempo real en una amplia variedad de dispositivos.

Estructura de texto

El Identificador de texto segmenta el texto en bloques, líneas, elementos y símbolos. En términos generales:

  • Un bloque es un conjunto contiguo de líneas de texto, como un párrafo o una columna

  • Una línea es un conjunto contiguo de palabras en el mismo eje.

  • un Elemento es un conjunto contiguo de caracteres alfanuméricos (palabra en el mismo eje en la mayoría de las lenguas latinas) o una palabra en otros.

  • Un símbolo es un carácter alfanumérico único que aparece en el mismo eje en la mayoría de los idiomas latinos, o un carácter en otros.

En la siguiente imagen, se destacan ejemplos de cada una de ellas en orden descendente. El primer bloque destacado, en cian, es un bloque de texto. El segundo conjunto de bloques destacados, en azul, son líneas de texto. Por último, el tercer conjunto de bloques destacados, en color azul oscuro, son las palabras.

Para todos los bloques, líneas, elementos y símbolos detectados, la API muestra los cuadros de límite, los puntos de esquina, la información de rotación, la puntuación de confianza, los idiomas reconocidos y el texto reconocido.

Resultados de ejemplo


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconocido
Texto Wege
der parlamentarischen
Democracia
Bloqueos (1 bloque)
Bloque 0
Texto Wege der parlamentarischen Democracia
Marco (296, 665 - 796, 882)
Puntos de esquina (296, 719), (778, 665), (796, 828), (314 y 882)
Código de idioma reconocido de
las líneas (3 líneas)
Línea 0
Texto Wer der
Marco (434, 678 - 670, 749)
Puntos de esquina (434, 705), (665, 678), (670, 722), (439, 749)
Código de idioma reconocido de
Nivel de confianza 0,8766741
Grado de rotación -6,6116457
Elementos (2 elementos)
Elemento 0
Texto Wege
Marco (434, 689 - 575, 749)
Puntos de esquina (434, 705), (570, 689), (575, 733), (439, 749)
Código de idioma reconocido de
Nivel de confianza 0,8964844
Grado de rotación -6,6116457
Elementos (4 elementos)
Símbolo 0
Texto W
Marco (434, 698 - 500, 749)
Puntos de esquina (434, 706), (495, 698), (500, 741), (439, 749)
Nivel de confianza 0,87109375
Grado de rotación -6,611646