Reconnaissance de texte

Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

L'API ML Kit Text Recognition peut reconnaître du texte dans n'importe quel jeu de caractères latins. Elle peut également être utilisée pour automatiser des tâches de saisie de données telles que le traitement des cartes de crédit, des reçus et des cartes de visite.

iOS Android

Capacités clés

  • Reconnaître du texte dans les langues latines : permet la reconnaissance de texte à l'aide des caractères latins.
  • Analyser la structure du texte Permet la détection de mots/éléments, de lignes et de paragraphes.
  • Identifier la langue du texte : identifie la langue du texte reconnu.
  • Peu d'encombrement de l'application Sur Android, l'API est proposée en tant que bibliothèque sans package via les services Google Play.
  • Reconnaissance en temps réel : reconnaît le texte en temps réel sur une large gamme d'appareils.

Structure du texte

La reconnaissance de texte segmente le texte en blocs, lignes, éléments et symboles. En gros:

  • Un bloc est un ensemble contigu de lignes de texte, tel qu'un paragraphe ou une colonne.

  • Une ligne est un ensemble de mots contigus sur le même axe.

  • Un élément est un ensemble contigu de caractères alphanumériques (« mot ») sur le même axe dans la plupart des langues latines, ou un mot dans d'autres

  • Un symbole est un caractère alphanumérique unique sur le même axe dans la plupart des langues latines, ou un caractère dans d'autres.

L'image ci-dessous met en évidence dans l'ordre décroissant chacune de ces options. Le premier bloc en surbrillance, cyan, est un bloc de texte. Le deuxième ensemble de blocs en surbrillance, en bleu, est constitué de lignes de texte. Enfin, le troisième ensemble de blocs en surbrillance, bleu foncé, est Words.

Pour tous les blocs, lignes, éléments et symboles détectés, l'API renvoie les cadres de délimitation, les points d'angle, les informations de rotation, le score de confiance, les langues reconnues et le texte reconnu.

Exemples de résultats


Photo : Dietmar Rabich, Wikimedia Commons, &Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texte reconnu
Texte Wege
der parlamentarischen
Demokratie
Contrôles (1 rue)
Bloc 0
Texte Wege der parlamentarischen Demokratie
Cadre (296 665-796 882)
Points d'angle (296, 719), (778, 665), (796, 828), (314, 882)
Code de langue reconnu de
Les lignes (3 lignes)
Ligne 0
Texte Wege der
Cadre (434, 678 - 670, 749)
Points d'angle (434, 705), (665, 678), (670, 722), (439, 749)
Code de langue reconnu de
Score de confiance 0,8766741
Degré de rotation -6,6116457
Éléments (2 éléments)
Élément 0
Texte Wege
Cadre (434, 689 - 575, 749)
Points d'angle (434, 705), (570, 689), (575, 733), (439, 749)
Code de langue reconnu de
Score de confiance 0,8964844
Degré de rotation -6,6116457
Éléments (4 éléments)
Symbole 0
Texte P
Cadre (434 698-500 749)
Points d'angle (434, 706), (495, 698), (500, 741), (439, 749)
Score de confiance 0,87109375
Degré de rotation -6,611646