التعرّف على النص - الإصدار 2

تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

يمكن أن تتعرّف واجهة برمجة التطبيقات للإصدار 2 من تقنية ML Kit على النص في أي مجموعة من الأحرف الصينية والديفانغارية واليابانية والكورية واللاتينية. ويمكن استخدام واجهة برمجة التطبيقات أيضًا لتنفيذ مهام إدخال البيانات بشكل تلقائي مثل معالجة بطاقات الائتمان والإيصالات وبطاقات الأنشطة التجارية.

نظام التشغيل iOS نظام التشغيل Android

الإمكانات الأساسية

  • التعرّف على النص على مستوى نصوص برمجية ولغات مختلفة يتيح التعرّف على النص باللغات الصينية والديفانغارية واليابانية واليابانية والكورية واللاتينية
  • تحليل بنية النص يتيح اكتشاف الرموز والعناصر والخطوط والفقرات
  • تحديد لغة النص لتحديد لغة النص الذي تم التعرّف عليه
  • التعرّف على الوقت الفعلي: يمكنها التعرّف على النص في الوقت الفعلي على مجموعة واسعة من الأجهزة.

بنية النص

تعمل أداة التعرّف على النص على تقسيم النص إلى كتل وخطوط وعناصر ورموز. تقريبًا:

  • تشير الحظر إلى مجموعة متوازية من الأسطر النصية، مثل فقرة أو عمود،

  • الخط هو مجموعة متجاورة من الكلمات على المحور نفسه

  • العنصر هو مجموعة متتابعة من الأحرف الأبجدية الرقمية ("word") على المحور نفسه بمعظم اللغات اللاتينية أو من كلمة في لغات أخرى

  • الرمز هو حرف واحد أبجدي رقمي على المحور نفسه في معظم اللغات اللاتينية أو حرف في لغات أخرى

توضّح الصورة أدناه أمثلة على كل منها بترتيب تنازلي. أول قالب مميّز، باللون السماوي، هو كتلة نص. المجموعة الثانية من القوالب المميزة باللون الأزرق هي سطور من النص. وأخيرًا، المجموعة الثالثة من الكُتَل المميَّزة، باللون الأزرق الغامق، هي Words.

بالنسبة إلى جميع الكتل والخطوط والعناصر والرموز التي تم اكتشافها، تعرض واجهة برمجة التطبيقات المربعات المربّعة ونقاط الزوايا ومعلومات التدوير ونتيجة الثقة واللغات المعترَف بها والنص الذي تم التعرف عليه.

أمثلة النتائج


الصورة: Deetmar Rabich، Wikimedia Commons، "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123"، CC BY-SA 4.0
نص تم التعرّف عليه
نص "ويجي"
der parlamentarischen
Demokratie
مرات صد الكرة (حظر واحد)
حظر 0
نص Wege der parlamentarischen Democratie
إطار (296, 665 - 796, 882)
نقاط الزوايا (296، 719)، (778، 665)، (796، 828)، (314، 882)
رمز اللغة المعترف به de
الأسطر (3 أسطر)
السطر 0
نص ويج دير
إطار (434، 678 - 670، 749)
نقاط الزوايا (434، 705)، (665، 678)، (670، 722)، (439، 749)
رمز اللغة المعترف به de
نتيجة الثقة 0.8766741
درجة التدوير -6.6116457
العناصر (عنصران)
العنصر 0
نص ويج
إطار (434، 689 - 575، 749)
نقاط الزوايا (434، 705)، (570، 689)، (575، 733)، (439، 749)
رمز اللغة المعترف به de
نتيجة الثقة 0.8964844
درجة التدوير -6.6116457
العناصر (4 عناصر)
الرمز 0
نص واط
إطار (434، 698 - 500، 749)
نقاط الزوايا (434، 706)، (495، 698)، (500، 741)، (439، 749)
نتيجة الثقة 0.87109375
درجة التدوير -6.611646