Interfejs ML Kit Text Recognition v2 rozpoznaje tekst w dowolnym zestawie znaków w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim. Interfejs API może również służyć do automatyzacji zadań wprowadzania danych, takich jak przetwarzanie kart kredytowych, rachunków czy wizytówek firm.
Najważniejsze funkcje
- Rozpoznawanie tekstu w różnych alfabetach i językach Obsługa rozpoznawania tekstu w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim
- Analizuje strukturę tekstu Umożliwia wykrywanie symboli, elementów, wierszy i akapitów.
- Określ język tekstu Określa język rozpoznanego tekstu.
- Rozpoznawanie w czasie rzeczywistym: rozpoznaje tekst w czasie rzeczywistym na wielu różnych urządzeniach
Struktura tekstu
Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. Ogólnie rzecz biorąc:
Blok to sąsiadujący się z nimi zestaw wierszy tekstu, np. akapit lub kolumna,
Linia to sąsiedni zestaw słów na tej samej osi,
Element to ciągły zestaw znaków alfanumerycznych („słowo”) na tej samej osi w większości języków łacińskich lub słowo w innych
Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach.
Na ilustracji poniżej pokazujemy przykłady każdej z tych opcji w kolejności malejącej. Pierwszy wyróżniony blok w kolorze turkusowym to blok tekstu. Drugi zestaw wyróżnionych bloków (kolor niebieski) to Wiersze tekstu. Trzeci zestaw wyróżnionych bloków, ciemnoniebieskich, to Words.
W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożne, informacje o rotacji, wskaźnik ufności, rozpoznawany język i rozpoznany tekst.
Przykładowe wyniki
Rozpoznany tekst | |
---|---|
Tekst | Wege der parlamentarischen Demokratie |
Bloki | (1 blok) |
Blok 0 | |
---|---|
Tekst | Wege der parlamentarischen Demokratie |
Ramka | (296, 665 – 796, 882) |
Punkty narożne | (296, 719), (778, 665), (796, 828), (314, 882) |
Rozpoznany kod języka | de |
Linie | (3 wiersze) |
Wiersz 0 | |
---|---|
Tekst | Wege der |
Ramka | (434, 678, 670, 749) |
Punkty narożne | (434, 705), (665, 678), (670, 722), (439, 749) |
Rozpoznany kod języka | de |
Wskaźnik ufności | 0,8766741 |
Stopień obrotu | -6,6116457 |
Elementy | (2 elementy) |
Element 0 | |
---|---|
Tekst | Wege |
Ramka | (434, 689, 575, 749) |
Punkty narożne | (434 705), (570, 689), (575, 733), (439, 749) |
Rozpoznany kod języka | de |
Wskaźnik ufności | 0,8964844 |
Stopień obrotu | -6,6116457 |
Elementy | (4 elementy) |
Symbol 0 | |
---|---|
Tekst | Ś |
Ramka | (434, 698, - 500, 749) |
Punkty narożne | (434, 706), (495, 698), (500, 741), (439, 749) |
Wskaźnik ufności | 0,87109375 |
Stopień obrotu | -6,611646 |