API ML Kit Text Recognition v2 می تواند متن را در هر مجموعه حروف چینی، دوانگاری، ژاپنی، کره ای و لاتین تشخیص دهد. همچنین میتوان از API برای خودکارسازی وظایف ورود دادهها مانند پردازش کارتهای اعتباری، رسیدها و کارتهای تجاری استفاده کرد.
قابلیت های کلیدی
- تشخیص متن در اسکریپت ها و زبان های مختلف پشتیبانی از تشخیص متن به زبان های چینی، دوانگاری، ژاپنی، کره ای و لاتین
- ساختار متن را تجزیه و تحلیل می کند از تشخیص نمادها، عناصر، خطوط و پاراگراف ها پشتیبانی می کند
- شناسایی زبان متن زبان متن شناسایی شده را شناسایی می کند
- تشخیص زمان واقعی می تواند متن را در زمان واقعی در طیف گسترده ای از دستگاه ها تشخیص دهد
ساختار متن
Text Recognizer متن را به بلوک ها، خطوط، عناصر و نمادها تقسیم می کند. به طور تقریبی:
Block مجموعه ای از خطوط متنی به هم پیوسته است، مانند یک پاراگراف یا ستون،
a Line مجموعه ای از کلمات به هم پیوسته در یک محور است و
یک عنصر مجموعه ای از نویسه های الفبایی عددی ("کلمه") در یک محور در اکثر زبان های لاتین یا یک کلمه در زبان های دیگر است.
نماد یک نویسه الفبایی منفرد در یک محور در اکثر زبان های لاتین یا یک کاراکتر در زبان های دیگر است.
تصویر زیر نمونه هایی از هر یک از این موارد را به ترتیب نزولی نشان می دهد. اولین بلوک برجسته، به رنگ فیروزه ای، یک بلوک متن است. مجموعه دوم بلوک های برجسته، به رنگ آبی، خطوط متن هستند. در نهایت، مجموعه سوم بلوک های برجسته، به رنگ آبی تیره، Words هستند.
برای تمام بلوکها، خطوط، عناصر و نمادهای شناساییشده، API کادرهای محدود، نقاط گوشه، اطلاعات چرخش، امتیاز اطمینان، زبانهای شناسایی شده و متن شناسایی شده را برمیگرداند.
نتایج نمونه
متن شناخته شده | |
---|---|
متن | Wege der parlamentarischen دموکراسی |
بلوک ها | (1 بلوک) |
بلوک 0 | |
---|---|
متن | Wege der parlamentarischen Demokratie |
قاب | (296، 665 - 796، 882) |
نقاط گوشه | (296، 719)، (778، 665)، (796، 828)، (314، 882) |
کد زبان شناخته شده | de |
خطوط | (3 خط) |
خط 0 | |
---|---|
متن | Wege der |
قاب | (434، 678 - 670، 749) |
نقاط گوشه | (434، 705)، (665، 678)، (670، 722)، (439، 749) |
کد زبان شناخته شده | de |
امتیاز اعتماد به نفس | 0.8766741 |
درجه چرخش | -6.6116457 |
عناصر | (2 عنصر) |
عنصر 0 | |
---|---|
متن | Wege |
قاب | (434، 689 - 575، 749) |
نقاط گوشه | (434، 705)، (570، 689)، (575، 733)، (439، 749) |
کد زبان شناخته شده | de |
امتیاز اعتماد به نفس | 0.8964844 |
درجه چرخش | -6.6116457 |
عناصر | (4 عنصر) |
نماد 0 | |
---|---|
متن | دبلیو |
قاب | (434، 698 - 500، 749) |
نقاط گوشه | (434، 706)، (495، 698)، (500، 741)، (439، 749) |
امتیاز اعتماد به نفس | 0.87109375 |
درجه چرخش | -6.611646 |