ML Kit की इमेज को लेबल करने वाले एपीआई की मदद से, कई कैटगरी के ग्रुप में मौजूद इमेज में मौजूद इकाइयों की पहचान की जा सकती है और उनसे जुड़ी जानकारी हासिल की जा सकती है. इमेज लेबल करने का डिफ़ॉल्ट मॉडल, सामान्य चीज़ों, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान कर सकता है.
किसी ख़ास इस्तेमाल के हिसाब से पहचान करने के लिए, कस्टम इमेज क्लासिफ़िकेशन मॉडल भी इस्तेमाल किया जा सकता है. ज़्यादा जानकारी के लिए, पसंद के मुताबिक बनाया गया TensorFlow Lite मॉडल इस्तेमाल करना देखें.
मुख्य सुविधाएं
- अलग-अलग कामों के लिए इस्तेमाल की जाने वाली कैटगरी में बदलाव करने वाला दमदार यह सुविधा, 400 से ज़्यादा कैटगरी की पहचान करती है. ये कैटगरी, फ़ोटो में सबसे ज़्यादा मिलने वाली चीज़ों के बारे में जानकारी देती हैं.
- कस्टम मॉडल की मदद से, अपने इस्तेमाल के हिसाब से बदलाव करें TensorFlow Hub के साथ, पहले से ट्रेन किए गए दूसरे मॉडल इस्तेमाल करें. इसके अलावा, अपने कस्टम मॉडल का इस्तेमाल करें, जिसे TensorFlow, AutoML Vision Edge या TensorFlow Lite Model Maker की मदद से ट्रेनिंग दी गई हो.
- इस्तेमाल में आसान हाई-लेवल एपीआई लो-लेवल के मॉडल इनपुट/आउटपुट, इमेज के पहले और बाद की प्रोसेसिंग या प्रोसेसिंग पाइपलाइन बनाने से जुड़ने की ज़रूरत नहीं होती. ML Kit, TensorFlow Lite मॉडल से लेबल हटाता है और उन्हें टेक्स्ट की जानकारी के तौर पर उपलब्ध कराता है.
ध्यान दें कि यह एपीआई, इमेज क्लासिफ़िकेशन मॉडल के लिए है, जो पूरी इमेज की जानकारी देते हैं. किसी इमेज में एक या एक से ज़्यादा ऑब्जेक्ट, जैसे कि जूते या फ़र्नीचर के हिस्सों की कैटगरी तय करने के लिए, ऑब्जेक्ट की पहचान और ट्रैकिंग एपीआई बेहतर हो सकता है.
इमेज क्लासिफ़िकेशन के मॉडल
इमेज लेबलिंग एपीआई, इमेज की कैटगरी तय करने वाले अलग-अलग मॉडल के साथ काम करता है:
इमेज क्लासिफ़िकेशन के मॉडल | |
---|---|
बेसिक मॉडल | डिफ़ॉल्ट रूप से, यह एपीआई अलग-अलग कामों के लिए इमेज को लेबल करने वाले बेहतरीन मॉडल का इस्तेमाल करता है. यह मॉडल 400 से ज़्यादा इकाइयों की पहचान करता है. ये इकाइयां, फ़ोटो के ऐसे कॉन्सेप्ट को कवर करती हैं जो आम तौर पर सबसे ज़्यादा मिलते हैं. |
पसंद के मुताबिक TensorFlow Lite मॉडल | ऐप्लिकेशन के खास सिद्धांतों को टारगेट करने के लिए, यह एपीआई कई तरह के सोर्स से पसंद के मुताबिक इमेज क्लासिफ़िकेशन मॉडल स्वीकार करता है. इनमें TensorFlow Hub से डाउनलोड किए गए, पहले से ट्रेन किए गए मॉडल हो सकते हैं. इसके अलावा, इनमें AutoML Vision Edge, TensorFlow Lite Model Maker या TensorFlow से ट्रेनिंग ली गई आपके मॉडल भी शामिल हो सकते हैं. मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Firebase मशीन लर्निंग के साथ होस्ट किया जा सकता है. साथ ही, इन्हें रन-टाइम पर डाउनलोड भी किया जा सकता है. |
बेस मॉडल का इस्तेमाल करना
एमएल किट का बेस मॉडल ऐसी इकाइयों की सूची दिखाता है जो लोगों, चीज़ों, जगहों, गतिविधियों वगैरह की पहचान करती हैं. हर इकाई के लिए एक स्कोर होता है, जिससे पता चलता है कि मशीन लर्निंग मॉडल कितने काम का है. इस जानकारी की मदद से, अपने-आप मेटाडेटा जनरेट होने और कॉन्टेंट मॉडरेशन जैसे काम किए जा सकते हैं. एमएल किट के साथ दिए गए डिफ़ॉल्ट मॉडल में 400 से ज़्यादा अलग-अलग इकाइयों की पहचान की जाती है.
लेबल के उदाहरण
इमेज लेबलिंग एपीआई के बेस मॉडल में 400 से ज़्यादा लेबल काम करते हैं, जैसे कि नीचे दिए गए उदाहरण:
कैटगरी | लेबल के उदाहरण |
---|---|
लोग | Crowd Selfie Smile |
गतिविधियां | Dancing Eating Surfing |
चीज़ें | Car Piano Receipt |
जानवर | Bird Cat Dog |
पौधे | Flower Fruit Vegetable |
जगहें | Beach Lake Mountain |
परिणामों के उदाहरण
यहां उन इकाइयों का उदाहरण दिया गया है जिन्हें साथ वाली फ़ोटो में पहचाना गया था.
लेबल 0 | |
---|---|
टेक्स्ट | स्टेडियम |
कॉन्फ़िडेंस | 0.9205354 |
लेबल 1 | |
टेक्स्ट | खेल |
कॉन्फ़िडेंस | 0.7531109 |
लेबल 2 | |
टेक्स्ट | इवेंट |
कॉन्फ़िडेंस | 0.66905296 |
लेबल 3 | |
टेक्स्ट | फ़ुर्सत के पल |
कॉन्फ़िडेंस | 0.59904146 |
लेबल 4 | |
टेक्स्ट | सॉकर (फ़ुटबॉल) |
कॉन्फ़िडेंस | 0.56384534 |
लेबल 5 | |
टेक्स्ट | कुल |
कॉन्फ़िडेंस | 0.54679185 |
लेबल 6 | |
टेक्स्ट | पौधा |
कॉन्फ़िडेंस | 0.524364 |
पसंद के मुताबिक बनाया गया TensorFlow Lite मॉडल इस्तेमाल करना
एमएल किट की बेस इमेज लेबलिंग मॉडल को, अलग-अलग कामों के लिए बनाया गया है. यह ट्रेनिंग ऐसी 400 कैटगरी की पहचान करने के लिए की गई है जो फ़ोटो में सबसे ज़्यादा खोजी जाने वाली चीज़ों की जानकारी देती हैं. आपको इमेज की कैटगरी तय करने वाले ऐसे खास मॉडल की ज़रूरत पड़ सकती है जो कैटगरी की सीमित संख्या के बारे में ज़्यादा जानकारी देता हो. उदाहरण के लिए, ऐसा मॉडल जो फूलों की प्रजातियों या अलग-अलग तरह की खाने की चीज़ों के बीच अंतर कर पाता है.
इस एपीआई की मदद से, कई तरह के सोर्स से कस्टम इमेज क्लासिफ़िकेशन मॉडल की सुविधा देकर, इस्तेमाल के किसी खास उदाहरण के हिसाब से बनाया जा सकता है. ज़्यादा जानने के लिए, कृपया एमएल किट वाले कस्टम मॉडल देखें. कस्टम मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Firebase मशीन लर्निंग की मॉडल डिप्लॉयमेंट सेवा का इस्तेमाल करके, क्लाउड से डाइनैमिक तौर पर डाउनलोड किया जा सकता है.
इनपुट इमेज की प्री-प्रोसेसिंग
ज़रूरत पड़ने पर, इमेज लेबलिंग में इमेज के साइज़ और आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) को अडजस्ट करने के लिए, बिलिनेयर इमेज स्केलिंग और स्ट्रेचिंग का इस्तेमाल किया जाता है, ताकि वे बुनियादी मॉडल की ज़रूरतों के हिसाब से हों.