文字辨識 v2

ML Kit Text Recognition v2 API 可辨識任何中文、梵文字母、日文、韓文和拉丁字元集的文字。這個 API 也可用來自動處理資料輸入工作,例如處理信用卡、收據和名片。

iOS Android

主要功能

  • 辨識各種指令碼和語言的文字:支援辨識中文、梵文字母、日文、韓文和拉丁字母的文字
  • 分析文字結構:支援偵測符號、元素、線條和段落
  • 辨識文字語言:辨識可辨識文字的語言
  • 即時辨識:可在多種裝置上即時辨識文字

文字結構

文字辨識器會將文字分成區塊、行、元素和符號。大聲說出:

  • 「區塊」是一組連續的文字行,例如段落或資料欄。

  • 「線條」是同一軸上的連續字詞組合,且

  • 「元素」是一組連續的英數字元 (「字詞」),在大部分拉丁語系中都在同一個軸上,也可能是其他語言的單字

  • 「符號」是單一拉丁字母在相同軸上的單一英數字元,或其他其他語言中的字元

下方圖片以低順序,分別列出這些範例。第一個醒目顯示的青色區塊是青色區塊。第二組以藍色醒目顯示的區塊是文字行。最後,第三組醒目顯示的深色區塊是深藍色,代表 Words。

針對所有偵測到的區塊、行、元素和符號,API 會傳回定界框、角落點、旋轉資訊、可信度分數、可辨識的語言和可辨識的文字。

搜尋結果範例


相片: Dietmar RabichWikimedia Commons"Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
辨識的文字
文字 校長
學士學位
民主國
模塊 (1 個區塊)
區塊 0
文字 民主黨國民
頁框 (296、665 - 796、882)
邊角 (296, 719), (778, 665), (796, 828), (314, 882)
已識別的語言代碼 de
路線 (3 行)
第 0 行
文字 韋格德
頁框 (434、678 - 670、749)
邊角 (434, 705), (665, 678), (670, 722), (439, 749)
已識別的語言代碼 de
可信度分數 0.8766741
旋轉角度 -6.6116457
元素 (2 個元素)
元素 0
文字
頁框 (434、689 - 575、749)
邊角 (434, 705), (570, 689), (575, 733), (439, 749)
已識別的語言代碼 de
可信度分數 0.8964844
旋轉角度 -6.6116457
元素 (4 個元素)
符號 0
文字
頁框 (434、698 - 500、749)
邊角 (434, 706), (495, 698), (500, 741), (439, 749)
可信度分數 0.87109375
旋轉角度 -6.611646