Rozpoznawanie tekstu, wersja 2

Interfejs ML Kit Text Recognition v2 rozpoznaje tekst w dowolnym zestawie znaków w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim. Interfejs API może również służyć do automatyzacji zadań wprowadzania danych, takich jak przetwarzanie kart kredytowych, rachunków czy wizytówek firm.

iOS Android

Najważniejsze funkcje

  • Rozpoznawanie tekstu w różnych alfabetach i językach Obsługa rozpoznawania tekstu w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim
  • Analizuje strukturę tekstu Umożliwia wykrywanie symboli, elementów, wierszy i akapitów.
  • Określ język tekstu Określa język rozpoznanego tekstu.
  • Rozpoznawanie w czasie rzeczywistym: rozpoznaje tekst w czasie rzeczywistym na wielu różnych urządzeniach

Struktura tekstu

Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. Ogólnie rzecz biorąc:

  • Blok to sąsiadujący się z nimi zestaw wierszy tekstu, np. akapit lub kolumna,

  • Linia to sąsiedni zestaw słów na tej samej osi,

  • Element to ciągły zestaw znaków alfanumerycznych („słowo”) na tej samej osi w większości języków łacińskich lub słowo w innych

  • Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach.

Na ilustracji poniżej pokazujemy przykłady każdej z tych opcji w kolejności malejącej. Pierwszy wyróżniony blok w kolorze turkusowym to blok tekstu. Drugi zestaw wyróżnionych bloków (kolor niebieski) to Wiersze tekstu. Trzeci zestaw wyróżnionych bloków, ciemnoniebieskich, to Words.

W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożne, informacje o rotacji, wskaźnik ufności, rozpoznawany język i rozpoznany tekst.

Przykładowe wyniki


Zdjęcie: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Rozpoznany tekst
Tekst Wege
der parlamentarischen
Demokratie
Bloki (1 blok)
Blok 0
Tekst Wege der parlamentarischen Demokratie
Ramka (296, 665 – 796, 882)
Punkty narożne (296, 719), (778, 665), (796, 828), (314, 882)
Rozpoznany kod języka de
Linie (3 wiersze)
Wiersz 0
Tekst Wege der
Ramka (434, 678, 670, 749)
Punkty narożne (434, 705), (665, 678), (670, 722), (439, 749)
Rozpoznany kod języka de
Wskaźnik ufności 0,8766741
Stopień obrotu -6,6116457
Elementy (2 elementy)
Element 0
Tekst Wege
Ramka (434, 689, 575, 749)
Punkty narożne (434 705), (570, 689), (575, 733), (439, 749)
Rozpoznany kod języka de
Wskaźnik ufności 0,8964844
Stopień obrotu -6,6116457
Elementy (4 elementy)
Symbol 0
Tekst Ś
Ramka (434, 698, - 500, 749)
Punkty narożne (434, 706), (495, 698), (500, 741), (439, 749)
Wskaźnik ufności 0,87109375
Stopień obrotu -6,611646