Riconoscimento del testo v2

L'API ML Kit Text Recognition v2 è in grado di riconoscere il testo in qualsiasi set di caratteri cinese, devanagari, giapponese, coreano e latino. L'API può essere utilizzata anche per automatizzare le attività di inserimento dati, come l'elaborazione di carte di credito, ricevute e biglietti da visita.

iOS Android

Funzionalità chiave

  • Riconoscere il testo in varie lingue e scrittura Supporta il riconoscimento del testo nelle scritture cinese, devanagari, giapponese, coreano e latino.
  • Analizza la struttura del testo Supporta il rilevamento di simboli, elementi, righe e paragrafi
  • Identifica la lingua del testo Identifica la lingua del testo riconosciuto
  • Riconoscimento in tempo reale Può riconoscere il testo in tempo reale su una vasta gamma di dispositivi.

Struttura del testo

Riconoscitore di testo suddivide il testo in blocchi, linee, elementi e simboli. Approfondimento:

  • un blocco è un insieme contiguo di righe di testo, come un paragrafo o una colonna,

  • Una linea è un insieme contiguo di parole sullo stesso asse e

  • un Elemento è un insieme contiguo di caratteri alfanumerici ("parola") sullo stesso asse nella maggior parte delle lingue latine o una parola in altre

  • un simbolo è un singolo carattere alfanumerico sullo stesso asse nella maggior parte delle lingue latine o un carattere in altre lingue

L'immagine seguente evidenzia esempi di ognuno di questi in ordine decrescente. Il primo blocco evidenziato, in ciano, è un blocco di testo. La seconda serie di blocchi evidenziati, in blu, è costituita da Linee di testo. Infine, la terza serie di blocchi evidenziati, in blu scuro, è denominata Parole.

Per tutti i blocchi, le linee, gli elementi e i simboli rilevati, l'API restituisce riquadri di delimitazione, punti d'angolo, informazioni sulla rotazione, punteggio di affidabilità, lingue riconosciute e testo riconosciuto.

Risultati di esempio


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Testo riconosciuto
Testo La storia
der parlamentarischen
Demokratie
Stoppate (1 blocco)
Blocco 0
Testo Wege der parlamentarischen Demokratie
Frame (296, 665 - 796, 882)
Punti d'angolo (296, 719), (778, 665), (796, 828), (314, 882)
Codice lingua riconosciuta de
Righe (3 righe)
Riga 0
Testo Wege der
Frame (434, 678 - 670, 749)
Punti d'angolo (434, 705), (665, 678), (670, 722), (439, 749)
Codice lingua riconosciuta de
Punteggio di affidabilità 0,8766741
Grado rotazione -6,6116457
Elementi (2 elementi)
Elemento 0
Testo Wege
Frame (434, 689 - 575, 749)
Punti d'angolo (434, 705), (570, 689), (575, 733), (439, 749)
Codice lingua riconosciuta de
Punteggio di affidabilità 0,8964844
Grado rotazione -6,6116457
Elementi (4 elementi)
Simbolo 0
Testo W
Frame (434, 698 - 500, 749)
Punti d'angolo (434 706), (495 698), (500 741), (439 749)
Punteggio di affidabilità 0,87109375
Grado rotazione -6,611646