L'API ML Kit Text Recognition 2 è in grado di riconoscere il testo in qualsiasi set di caratteri cinesi, devanagari, giapponesi, coreani e latini. L'API può essere utilizzata anche per automatizzare attività di inserimento dati come l'elaborazione di carte di credito, ricevute e biglietti da visita.
Funzionalità chiave
- Riconosci il testo in vari linguaggi e lingue Supporta il riconoscimento dei testi in cinese, devanagari, giapponese, coreano e latino
- Analizza la struttura del testo Supporta il rilevamento di simboli, elementi, righe e paragrafi
- Identifica la lingua del testo Identifica la lingua del testo riconosciuto
- Riconoscimento in tempo reale può riconoscere il testo in tempo reale su una vasta gamma di dispositivi
Struttura del testo
Lo strumento di riconoscimento del testo suddivide il testo in blocchi, righe, elementi e simboli. In breve:
un blocco è un insieme contiguo di righe di testo, come un paragrafo o una colonna,
Una linea è un insieme di parole contigue sullo stesso asse; e
un Elemento è un insieme contiguo di caratteri alfanumerici ("parola") sullo stesso asse nella maggior parte delle lingue latine o in una parola negli altri
un Simbolo è un singolo carattere alfanumerico sullo stesso asse nella maggior parte delle lingue latine o un carattere in altre
L'immagine seguente mostra alcuni esempi in ordine decrescente. Il primo blocco evidenziato, in ciano, è un blocco di testo. La seconda serie di blocchi evidenziati, in blu, è Righe di testo. Infine, il terzo insieme di blocchi evidenziati, in blu scuro, sono Words.
Per tutti i blocchi, le linee, gli elementi e i simboli rilevati, l'API restituisce riquadri di delimitazione, punti angolari, informazioni sulla rotazione, punteggio di affidabilità, lingue riconosciute e testo riconosciuto.
Risultati di esempio

Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Testo riconosciuto | |
---|---|
Testo | Wege der parlamentarischen Demokratie |
Blocchi | (1 blocco) |
Blocca 0 | |
---|---|
Testo | Mug der parlamentarischen Demokratie |
Frame | (296, 665 - 796, 882) |
Punti d'angolo | (296, 719), (778, 665), (796, 828), (314, 882) |
Codice lingua riconosciuto | de |
Linee | (3 righe) |
Riga 0 | |
---|---|
Testo | Wege der |
Frame | (434, 678 - 670, 749) |
Punti d'angolo | (434, 705), (665, 678), (670, 722), (439, 749) |
Codice lingua riconosciuto | de |
Punteggio di affidabilità | 0,8766741 |
Grado di rotazione | -6,6116457 |
Elementi | (2 elementi) |
Elemento 0 | |
---|---|
Testo | Wege |
Frame | (434, 689 - 575, 749) |
Punti d'angolo | (434, 705), (570, 689), (575, 733), (439, 749) |
Codice lingua riconosciuto | de |
Punteggio di affidabilità | 0,8964844 |
Grado di rotazione | -6,6116457 |
Elementi | (4 elementi) |
Simbolo 0 | |
---|---|
Testo | W |
Frame | (434, 698 - 500, 749) |
Punti d'angolo | (434, 706), (495, 698), (500, 741), (439, 749) |
Punteggio di affidabilità | 0,87109375 |
Grado di rotazione | -6,611646 |