Pengenalan teks v2

API Pengenalan Teks ML Kit v2 dapat mengenali teks dalam himpunan karakter China, Devanagari, Jepang, Korea, dan Latin. API ini juga dapat digunakan untuk mengotomatiskan tugas entri data seperti memproses kartu kredit, tanda terima, dan kartu nama.

iOS Android

Kemampuan utama

  • Mengenali teks di berbagai skrip dan bahasa Mendukung pengenalan teks dalam skrip China, Devanagari, Jepang, Korea, dan Latin
  • Menganalisis struktur teks Mendukung deteksi simbol, elemen, garis, dan paragraf
  • Identifikasi bahasa teks Mengidentifikasi bahasa teks yang dikenali
  • Pengenalan real-time Dapat mengenali teks secara real time di berbagai perangkat

Struktur teks

Pengenal Teks memilah teks menjadi blok, garis, elemen, dan simbol. Secara garis besar:

  • Blok adalah rangkaian baris teks yang berdekatan, seperti paragraf atau kolom,

  • Garis adalah rangkaian kata yang berdekatan pada sumbu yang sama, dan

  • Elemen adalah kumpulan karakter alfanumerik ("kata") yang berdekatan pada sumbu yang sama dalam sebagian besar bahasa Latin, atau kata dalam bahasa lainnya

  • Simbol adalah karakter alfanumerik tunggal pada sumbu yang sama dalam kebanyakan bahasa Latin, atau karakter dalam bahasa lain

Gambar di bawah menyoroti contoh masing-masing dalam urutan menurun. Blok yang pertama kali ditandai, dalam warna sian, adalah Blok teks. Kumpulan kedua blok yang disorot, dengan warna biru, adalah Baris teks. Terakhir, kumpulan ketiga blok yang disorot, dengan warna biru tua, adalah Words.

Untuk semua blok, garis, elemen, dan simbol yang terdeteksi, API akan menampilkan kotak pembatas, titik sudut, informasi rotasi, skor keyakinan, bahasa yang dikenali, dan teks yang dikenali.

Hasil contoh


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Teks yang Dikenali
Teks Wege
der parlamentarischen
Demokratie
Block (1 blok)
Blok 0
Teks Wege der parlamentarischen Demokratie
Bingkai (296, 665 - 796, 882)
Titik Sudut (296, 719), (778, 665), (796, 828), (314, 882)
Kode Bahasa yang Dikenali de
Jalur (3 baris)
Baris 0
Teks Wege Der
Bingkai (434, 678 - 670, 749)
Titik Sudut (434, 705), (665, 678), (670, 722), (439, 749)
Kode Bahasa yang Dikenali de
Skor Keyakinan 0,8766741
Derajat Rotasi -6,6116457
Elemen (2 elemen)
Elemen 0
Teks Wege
Bingkai (434, 689 - 575, 749)
Titik Sudut (434, 705), (570, 689), (575, 733), (439, 749)
Kode Bahasa yang Dikenali de
Skor Keyakinan 0,8964844
Derajat Rotasi -6,6116457
Elemen (4 elemen)
Simbol 0
Teks W
Bingkai (434, 698 - 500, 749)
Titik Sudut (434, 706), (495, 698), (500, 741), (439, 749)
Skor Keyakinan 0,87109375
Derajat Rotasi -6,611646