التعرّف على النص

تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

يمكن لواجهة برمجة تطبيقات التعرّف على النص من ML Kit التعرّف على النص في أي مجموعة من الأحرف اللاتينية. ويمكن استخدامها أيضًا في برمجة مهام إدخال البيانات، مثل معالجة بطاقات الائتمان والإيصالات وبطاقات الأنشطة التجارية.

نظام التشغيل iOS نظام التشغيل Android

الإمكانات الأساسية

  • تمييز النص في اللغات اللاتينية يتيح التعرّف على النص باستخدام النصوص اللاتينية.
  • تحليل بنية النص إتاحة رصد الكلمات/العناصر والخطوط والفقرات
  • تحديد لغة النص لتحديد لغة النص الذي تم التعرّف عليه
  • البصمة الفرعية للتطبيقات الصغيرة على نظام التشغيل Android، يتم تقديم واجهة برمجة التطبيقات كمكتبة غير مجمّعة من خلال خدمات Google Play.
  • التعرّف على الوقت الفعلي: يمكنها التعرّف على النص في الوقت الفعلي على مجموعة واسعة من الأجهزة.

بنية النص

تعمل أداة التعرّف على النص على تقسيم النص إلى كتل وخطوط وعناصر ورموز. تقريبًا:

  • تشير الحظر إلى مجموعة متوازية من الأسطر النصية، مثل فقرة أو عمود،

  • الخط هو مجموعة متجاورة من الكلمات على المحور نفسه

  • العنصر هو مجموعة متتابعة من الأحرف الأبجدية الرقمية ("word") على المحور نفسه بمعظم اللغات اللاتينية أو من كلمة في لغات أخرى

  • الرمز هو حرف واحد أبجدي رقمي على المحور نفسه في معظم اللغات اللاتينية أو حرف في لغات أخرى

توضّح الصورة أدناه أمثلة على كل منها بترتيب تنازلي. أول قالب مميّز، باللون السماوي، هو كتلة نص. المجموعة الثانية من القوالب المميزة باللون الأزرق هي سطور من النص. وأخيرًا، المجموعة الثالثة من الكُتَل المميَّزة، باللون الأزرق الغامق، هي Words.

بالنسبة إلى جميع الكتل والخطوط والعناصر والرموز التي تم اكتشافها، تعرض واجهة برمجة التطبيقات المربعات المربّعة ونقاط الزوايا ومعلومات التدوير ونتيجة الثقة واللغات المعترَف بها والنص الذي تم التعرف عليه.

أمثلة النتائج


الصورة: Deetmar Rabich، Wikimedia Commons، "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123"، CC BY-SA 4.0
نص تم التعرّف عليه
نص "ويجي"
der parlamentarischen
Demokratie
مرات صد الكرة (حظر واحد)
حظر 0
نص Wege der parlamentarischen Democratie
إطار (296, 665 - 796, 882)
نقاط الزوايا (296، 719)، (778، 665)، (796، 828)، (314، 882)
رمز اللغة المعترف به de
الأسطر (3 أسطر)
السطر 0
نص ويج دير
إطار (434، 678 - 670، 749)
نقاط الزوايا (434، 705)، (665، 678)، (670، 722)، (439، 749)
رمز اللغة المعترف به de
نتيجة الثقة 0.8766741
درجة التدوير -6.6116457
العناصر (عنصران)
العنصر 0
نص ويج
إطار (434، 689 - 575، 749)
نقاط الزوايا (434، 705)، (570، 689)، (575، 733)، (439، 749)
رمز اللغة المعترف به de
نتيجة الثقة 0.8964844
درجة التدوير -6.6116457
العناصر (4 عناصر)
الرمز 0
نص واط
إطار (434، 698 - 500، 749)
نقاط الزوايا (434، 706)، (495، 698)، (500، 741)، (439، 749)
نتيجة الثقة 0.87109375
درجة التدوير -6.611646