التعرّف على النص - الإصدار 2

يمكن لواجهة برمجة التطبيقات الإصدار 2 من واجهة برمجة التطبيقات التعرّف على النص في ML Kit التعرّف على النص بأيّ مجموعة أحرف صينية أو ديفاناغارية أو يابانية أو كورية أو لاتينية. يمكن أيضًا استخدام واجهة برمجة التطبيقات لأتمتة مهام إدخال البيانات مثل معالجة بطاقات الائتمان والإيصالات وبطاقات العمل.

iOS Android

الإمكانات الرئيسية

  • التعرف على النص عبر النصوص البرمجية واللغات المختلفة يدعم التعرف على النص باللغات الصينية والديفاناغارية واليابانية والكورية واللاتينية
  • تحليل بنية النص تدعم اكتشاف الرموز والعناصر والأسطر والفقرات
  • تحديد لغة النص: يتم تحديد لغة النص الذي تم التعرّف عليه.
  • التعرف في الوقت الفعلي يمكنه التعرف على النص في الوقت الفعلي على مجموعة واسعة من الأجهزة

بنية النص

تعمل أداة التعرّف على النص على تقسيم النص إلى كتل وخطوط وعناصر ورموز. بشكل تقريبي:

  • الحظر عبارة عن مجموعة متجاورة من أسطر النص، مثل فقرة أو عمود،

  • الخط هو مجموعة متجاورة من الكلمات على المحور نفسه،

  • العنصر هو مجموعة متجاورة من الأحرف الأبجدية الرقمية ("كلمة") على المحور نفسه في معظم اللغات اللاتينية أو كلمة في لغات أخرى

  • الرمز هو حرف أبجدي رقمي واحد على المحور نفسه في معظم اللغات اللاتينية، أو حرفًا في لغات أخرى.

توضح الصورة أدناه أمثلة لكل منها بترتيب تنازلي. والكتلة الأولى المميزة باللون السماوي هي كتلة من النص. المجموعة الثانية من الكتل المميزة، باللون الأزرق، هي خطوط النص. أخيرًا، المجموعة الثالثة من الكتل المميزة، باللون الأزرق الداكن، هي Words.

لجميع القوالب والخطوط والعناصر والرموز المكتشفة، تعرض واجهة برمجة التطبيقات مربعات الإحاطة ونقاط الزوايا ومعلومات التدوير، ودرجة الثقة، واللغات التي يتم التعرف عليها والنص الذي تم التعرف عليه.

أمثلة النتائج


الصورة: ديتمار رابيتش، ويكيميديا كومنز، "دوسلدورف، Wege der parlamentarischen Demokratie -- 2015 -- 8123"، CC BY-SA 4.0
النص الذي تم التعرّف عليه
النص Wege
der parlamentarischen
Demokratie
عدد مرّات صدّ القرص (جزء واحد)
القالب 0
النص Wege der Parlamentarischen DemoKatie
إطار (296، 665 - 796، 882)
نقاط الزوايا (296، 719)، (778، 665)، (796، 828)، (314، 882)
رمز اللغة التي تم التعرّف عليها de
الأسطر (3 أسطر)
السطر 0
النص فيجي دير
إطار (434، 678 - 670، 749)
نقاط الزوايا (434، 705)، (665، 678)، (670، 722)، (439، 749)
رمز اللغة التي تم التعرّف عليها de
نتيجة الثقة 0.8766741
درجة التدوير -6.6116457
العناصر (عنصران)
العنصر 0
النص فيج
إطار (434، 689 - 575، 749)
نقاط الزوايا (434، 705)، (570، 689)، (575، 733)، (439، 749)
رمز اللغة التي تم التعرّف عليها de
نتيجة الثقة 0.8964844
درجة التدوير -6.6116457
العناصر (4 عناصر)
الرمز 0
النص واط
إطار (434، 698 - 500، 749)
نقاط الزوايا (434، 706)، (495، 698)، (500، 741)، (439، 749)
نتيجة الثقة 0.87109375
درجة التدوير -6.611646