
ML Kit के इमेज लेबलिंग एपीआई की मदद से, इमेज में मौजूद अलग-अलग तरह की चीज़ों की पहचान की जा सकती है. साथ ही, उनके बारे में जानकारी निकाली जा सकती है. इमेज लेबलिंग का डिफ़ॉल्ट मॉडल, सामान्य चीज़ों, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान कर सकता है.
किसी खास इस्तेमाल के लिए ऑब्जेक्ट का पता लगाने की सुविधा को अपनी ज़रूरत के हिसाब से बनाने के लिए, कस्टम इमेज क्लासिफ़िकेशन मॉडल का भी इस्तेमाल किया जा सकता है. ज़्यादा जानकारी के लिए, कस्टम LiteRT मॉडल का इस्तेमाल करना लेख पढ़ें.
मुख्य सुविधाएं
- सामान्य मकसद के लिए इस्तेमाल किया जाने वाला एक बेहतरीन बेस क्लासिफ़ायर यह 400 से ज़्यादा कैटगरी की पहचान करता है. इन कैटगरी में, फ़ोटो में आम तौर पर दिखने वाली चीज़ों के बारे में बताया जाता है.
- अपनी ज़रूरत के हिसाब से कस्टम मॉडल इस्तेमाल करें TensorFlow Hub से पहले से ट्रेन किए गए अन्य मॉडल या TensorFlow, AutoML या LiteRT से ट्रेन किया गया अपना कस्टम मॉडल इस्तेमाल करें.
- इस्तेमाल में आसान हाई-लेवल एपीआई मॉडल के इनपुट/आउटपुट, इमेज की प्री-प्रोसेसिंग और पोस्ट-प्रोसेसिंग या प्रोसेसिंग पाइपलाइन बनाने के लिए, लो-लेवल एपीआई का इस्तेमाल करने की ज़रूरत नहीं होती. ML Kit, LiteRT मॉडल से लेबल निकालता है और उन्हें टेक्स्ट के तौर पर उपलब्ध कराता है.
ध्यान दें कि यह एपीआई, इमेज क्लासिफ़िकेशन मॉडल के लिए है. यह पूरी इमेज के बारे में बताता है. किसी इमेज में मौजूद एक या उससे ज़्यादा ऑब्जेक्ट, जैसे कि जूते या फ़र्नीचर के टुकड़ों को क्लासिफ़ाई करने के लिए, ऑब्जेक्ट का पता लगाने और उसे ट्रैक करने वाला एपीआई बेहतर हो सकता है.
इमेज क्लासिफ़िकेशन के लिए इस्तेमाल किए जा सकने वाले मॉडल
इमेज लेबलिंग एपीआई, इमेज क्लासिफ़िकेशन के अलग-अलग मॉडल के साथ काम करते हैं:
| इमेज क्लासिफ़िकेशन के लिए इस्तेमाल किए जा सकने वाले मॉडल | |
|---|---|
| बेस मॉडल | एपीआई डिफ़ॉल्ट रूप से, इमेज को लेबल करने वाले एक ऐसे मॉडल का इस्तेमाल करता है जो सामान्य तौर पर काम करता है. यह मॉडल, 400 से ज़्यादा इकाइयों की पहचान कर सकता है. साथ ही, यह फ़ोटो में मौजूद सबसे सामान्य कॉन्सेप्ट को कवर करता है. |
| कस्टम LiteRT मॉडल | ऐप्लिकेशन से जुड़े खास कॉन्सेप्ट को टारगेट करने के लिए, यह एपीआई अलग-अलग सोर्स से कस्टम इमेज क्लासिफ़िकेशन मॉडल स्वीकार करता है. ये पहले से ट्रेन किए गए मॉडल हो सकते हैं. इन्हें TensorFlow Hub से डाउनलोड किया जा सकता है. इसके अलावा, ये AutoML, LiteRT या TensorFlow की मदद से ट्रेन किए गए आपके अपने मॉडल भी हो सकते हैं. मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Cloud Storage के साथ होस्ट किया जा सकता है. साथ ही, रन-टाइम के दौरान डाउनलोड किया जा सकता है. |
बेस मॉडल का इस्तेमाल करना
ML Kit का बेस मॉडल, लोगों, चीज़ों, जगहों, गतिविधियों वगैरह की पहचान करने वाली इकाइयों की सूची दिखाता है. हर इकाई के साथ एक स्कोर होता है. इससे पता चलता है कि एमएल मॉडल को उसकी अहमियत पर कितना भरोसा है. इस जानकारी की मदद से, मेटाडेटा अपने-आप जनरेट होने और कॉन्टेंट की निगरानी करने जैसे टास्क किए जा सकते हैं. ML Kit के साथ उपलब्ध डिफ़ॉल्ट मॉडल, 400 से ज़्यादा अलग-अलग इकाइयों की पहचान करता है.
लेबल के उदाहरण
इमेज लेबलिंग एपीआई में मौजूद बेस मॉडल, 400 से ज़्यादा लेबल के साथ काम करता है. जैसे, यहां दिए गए उदाहरण:
| कैटगरी | लेबल के उदाहरण |
|---|---|
| लोग | CrowdSelfieSmile |
| गतिविधियां | DancingEatingSurfing |
| चीज़ें | CarPianoReceipt |
| जानवर | BirdCatDog |
| पौधे | FlowerFruitVegetable |
| जगहें | BeachLakeMountain |
परिणामों के उदाहरण
यहां साथ में दी गई फ़ोटो में पहचानी गई इकाइयों का उदाहरण दिया गया है.
| लेबल 0 | |
|---|---|
| टेक्स्ट | स्टेडियम |
| कॉन्फ़िडेंस | 0.9205354 |
| लेबल 1 | |
| टेक्स्ट | खेल |
| कॉन्फ़िडेंस | 0.7531109 |
| लेबल 2 | |
| टेक्स्ट | इवेंट |
| कॉन्फ़िडेंस | 0.66905296 |
| लेबल 3 | |
| टेक्स्ट | फ़ुर्सत के पल |
| कॉन्फ़िडेंस | 0.59904146 |
| लेबल 4 | |
| टेक्स्ट | सॉकर |
| कॉन्फ़िडेंस | 0.56384534 |
| लेबल 5 | |
| टेक्स्ट | कुल |
| कॉन्फ़िडेंस | 0.54679185 |
| लेबल 6 | |
| टेक्स्ट | पौधा |
| कॉन्फ़िडेंस | 0.524364 |
कस्टम LiteRT मॉडल का इस्तेमाल करना
ML Kit का इमेज लेबलिंग मॉडल, सामान्य इस्तेमाल के लिए बनाया गया है. इसे 400 कैटगरी की पहचान करने के लिए ट्रेन किया गया है. ये कैटगरी, फ़ोटो में सबसे ज़्यादा दिखने वाली चीज़ों के बारे में बताती हैं. आपके ऐप्लिकेशन को इमेज क्लासिफ़िकेशन के खास मॉडल की ज़रूरत पड़ सकती है. यह मॉडल, कम कैटगरी को ज़्यादा बारीकी से पहचानता है. जैसे, ऐसा मॉडल जो फूलों की प्रजातियों या खाने के टाइप के बीच अंतर करता है.
यह एपीआई, इस्तेमाल के किसी खास उदाहरण के हिसाब से बनाया जा सकता है. इसके लिए, यह अलग-अलग सोर्स से कस्टम इमेज क्लासिफ़िकेशन मॉडल इस्तेमाल करने की सुविधा देता है. ज़्यादा जानने के लिए, ML Kit के साथ कस्टम मॉडल देखें. कस्टम मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Cloud Storage से डाइनैमिक तौर पर डाउनलोड किया जा सकता है.
इनपुट इमेज की प्रीप्रोसेसिंग
ज़रूरत पड़ने पर, इमेज लेबलिंग की सुविधा, इमेज के साइज़ और आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) को अडजस्ट करने के लिए, इमेज को बड़ा करने और खींचने की बाइलिनियर तकनीक का इस्तेमाल करती है. इससे, इमेज को मॉडल की ज़रूरी शर्तों के मुताबिक बनाया जा सकता है.