ML Kit-এর ইমেজ লেবেলিং এপিআই-এর সাহায্যে আপনি একটি বিস্তৃত শ্রেণীতে একটি ইমেজে সত্তা সম্পর্কে তথ্য সনাক্ত করতে এবং বের করতে পারেন। ডিফল্ট ইমেজ লেবেলিং মডেল সাধারণ বস্তু, স্থান, কার্যকলাপ, প্রাণীর প্রজাতি, পণ্য এবং আরও অনেক কিছু সনাক্ত করতে পারে।
আপনি একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে সনাক্তকরণের জন্য একটি কাস্টম চিত্র শ্রেণীবিভাগ মডেল ব্যবহার করতে পারেন। আরও তথ্যের জন্য একটি কাস্টম টেনসরফ্লো লাইট মডেল ব্যবহার করা দেখুন।
মূল ক্ষমতা
- একটি শক্তিশালী সাধারণ-উদ্দেশ্য বেস ক্লাসিফায়ার 400 টিরও বেশি বিভাগকে শনাক্ত করে যা ফটোতে সর্বাধিক পাওয়া বস্তুগুলিকে বর্ণনা করে৷
- কাস্টম মডেলগুলির সাথে আপনার ব্যবহারের ক্ষেত্রে উপযোগী করুন টেনসরফ্লো হাব থেকে অন্যান্য প্রাক-প্রশিক্ষিত মডেল বা টেনসরফ্লো, অটোএমএল ভিশন এজ বা টেনসরফ্লো লাইট মডেল মেকারের সাথে প্রশিক্ষিত আপনার নিজস্ব কাস্টম মডেল ব্যবহার করুন৷
- সহজে-ব্যবহারযোগ্য উচ্চ-স্তরের এপিআইগুলি নিম্ন-স্তরের মডেল ইনপুট/আউটপুট, চিত্রের পূর্ব এবং পরবর্তী প্রক্রিয়াকরণ, বা একটি প্রক্রিয়াকরণ পাইপলাইন নির্মাণের সাথে মোকাবিলা করার প্রয়োজন নেই। ML Kit TensorFlow Lite মডেল থেকে লেবেলগুলি বের করে এবং সেগুলিকে একটি পাঠ্য বিবরণ হিসাবে প্রদান করে৷
মনে রাখবেন যে এই APIটি ইমেজ ক্লাসিফিকেশন মডেলের জন্য তৈরি করা হয়েছে যা সম্পূর্ণ ইমেজ বর্ণনা করে। একটি ছবিতে এক বা একাধিক বস্তুর শ্রেণিবিন্যাস করার জন্য, যেমন জুতা বা আসবাবের টুকরো, অবজেক্ট ডিটেকশন অ্যান্ড ট্র্যাকিং এপিআই একটি ভাল ফিট হতে পারে।
সমর্থিত ইমেজ শ্রেণীবিভাগ মডেল
ইমেজ লেবেলিং এপিআই বিভিন্ন ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করে:
সমর্থিত ইমেজ শ্রেণীবিভাগ মডেল | |
---|---|
বেস মডেল | ডিফল্টরূপে API একটি শক্তিশালী সাধারণ-উদ্দেশ্য ইমেজ লেবেলিং মডেল ব্যবহার করে যা 400 টিরও বেশি সত্ত্বাকে স্বীকৃতি দেয় যা ফটোতে সবচেয়ে সাধারণভাবে পাওয়া ধারণাগুলিকে কভার করে৷ |
কাস্টম টেনসরফ্লো লাইট মডেল | অ্যাপ্লিকেশান-নির্দিষ্ট ধারণাগুলিকে লক্ষ্য করতে, API বিস্তৃত উত্স থেকে কাস্টম চিত্র শ্রেণীবিভাগ মডেলগুলি গ্রহণ করে৷ এগুলি হতে পারে টেনসরফ্লো হাব থেকে ডাউনলোড করা প্রাক-প্রশিক্ষিত মডেল বা অটোএমএল ভিশন এজ, টেনসরফ্লো লাইট মডেল মেকার বা টেনসরফ্লো নিজে প্রশিক্ষিত আপনার নিজের মডেল। মডেলগুলি আপনার অ্যাপের সাথে বান্ডিল করা যেতে পারে বা Firebase মেশিন লার্নিং দিয়ে হোস্ট করা যেতে পারে এবং রান-টাইমে ডাউনলোড করা যেতে পারে। |
বেস মডেল ব্যবহার করে
ML Kit-এর বেস মডেলটি সত্তার একটি তালিকা প্রদান করে যা মানুষ, জিনিস, স্থান, কার্যকলাপ ইত্যাদি সনাক্ত করে। প্রতিটি সত্তা একটি স্কোর নিয়ে আসে যা নির্দেশ করে যে ML মডেলের প্রাসঙ্গিকতার উপর আস্থা রয়েছে। এই তথ্য দিয়ে, আপনি স্বয়ংক্রিয় মেটাডেটা তৈরি এবং বিষয়বস্তু সংযম করার মতো কাজগুলি সম্পাদন করতে পারেন৷ এমএল কিটের সাথে প্রদত্ত ডিফল্ট মডেলটি 400 টিরও বেশি বিভিন্ন সত্তাকে স্বীকৃতি দেয়৷
উদাহরণ লেবেল
ইমেজ লেবেলিং API-এর বেস মডেল 400+ লেবেল সমর্থন করে, যেমন নিম্নলিখিত উদাহরণগুলি:
শ্রেণী | উদাহরণ লেবেল |
---|---|
মানুষ | Crowd Selfie Smile |
কার্যক্রম | Dancing Eating Surfing |
জিনিস | Car Piano Receipt |
প্রাণী | Bird Cat Dog |
গাছপালা | Flower Fruit Vegetable |
জায়গা | Beach Lake Mountain |
উদাহরণ ফলাফল
এখানে সেই সত্তাগুলির একটি উদাহরণ রয়েছে যা সহগামী ফটোতে স্বীকৃত হয়েছিল৷
লেবেল 0 | |
---|---|
পাঠ্য | স্টেডিয়াম |
আত্মবিশ্বাস | 0.9205354 |
লেবেল 1 | |
পাঠ্য | খেলাধুলা |
আত্মবিশ্বাস | 0.7531109 |
লেবেল 2 | |
পাঠ্য | ঘটনা |
আত্মবিশ্বাস | 0.66905296 |
লেবেল 3 | |
পাঠ্য | অবসর |
আত্মবিশ্বাস | 0.59904146 |
লেবেল 4 | |
পাঠ্য | সকার |
আত্মবিশ্বাস | ০.৫৬৩৮৪৫৩৪ |
লেবেল 5 | |
পাঠ্য | নেট |
আত্মবিশ্বাস | 0.54679185 |
লেবেল 6 | |
পাঠ্য | উদ্ভিদ |
আত্মবিশ্বাস | 0.524364 |
একটি কাস্টম টেনসরফ্লো লাইট মডেল ব্যবহার করা হচ্ছে
এমএল কিটের বেস ইমেজ লেবেলিং মডেলটি সাধারণ ব্যবহারের জন্য তৈরি করা হয়েছে। এটি 400টি বিভাগ চিনতে প্রশিক্ষিত যা ফটোতে সবচেয়ে বেশি পাওয়া বস্তুর বর্ণনা দেয়। আপনার অ্যাপ্লিকেশানের একটি বিশেষ চিত্র শ্রেণিবিন্যাসের মডেলের প্রয়োজন হতে পারে যা আরও বিস্তারিতভাবে একটি সংকীর্ণ সংখ্যক বিভাগকে স্বীকৃতি দেয়, যেমন একটি মডেল যা ফুলের প্রজাতি বা খাবারের প্রকারের মধ্যে পার্থক্য করে।
এই API আপনাকে বিস্তৃত উৎস থেকে কাস্টম ইমেজ শ্রেণীবিভাগ মডেল সমর্থন করে একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে উপযোগী করতে দেয়। আরও জানতে অনুগ্রহ করে ML কিট সহ কাস্টম মডেলগুলি পড়ুন৷ কাস্টম মডেলগুলি আপনার অ্যাপের সাথে বান্ডিল করা যেতে পারে বা ফায়ারবেস মেশিন লার্নিং এর মডেল ডিপ্লয়মেন্ট পরিষেবা ব্যবহার করে ক্লাউড থেকে গতিশীলভাবে ডাউনলোড করা যেতে পারে।
ইনপুট ইমেজ প্রিপ্রসেসিং
যদি প্রয়োজন হয়, ইমেজ লেবেলিং বাইলিনিয়ার ইমেজ স্কেলিং এবং স্ট্রেচিং ব্যবহার করে ইনপুট ইমেজ সাইজ এবং অ্যাসপেক্ট রেশিও সামঞ্জস্য করে যাতে সেগুলি অন্তর্নিহিত মডেলের প্রয়োজনীয়তা পূরণ করে।