इमेज को लेबल करें

ML Kit के इमेज लेबलिंग एपीआई की मदद से, इमेज में मौजूद अलग-अलग तरह की चीज़ों की पहचान की जा सकती है. साथ ही, उनके बारे में जानकारी निकाली जा सकती है. इमेज लेबलिंग का डिफ़ॉल्ट मॉडल, सामान्य चीज़ों, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान कर सकता है.

किसी खास इस्तेमाल के लिए ऑब्जेक्ट का पता लगाने की सुविधा को अपनी ज़रूरत के हिसाब से बनाने के लिए, कस्टम इमेज क्लासिफ़िकेशन मॉडल का भी इस्तेमाल किया जा सकता है. ज़्यादा जानकारी के लिए, कस्टम LiteRT मॉडल का इस्तेमाल करना लेख पढ़ें.

मुख्य सुविधाएं

  • सामान्य मकसद के लिए इस्तेमाल किया जाने वाला एक बेहतरीन बेस क्लासिफ़ायर यह 400 से ज़्यादा कैटगरी की पहचान करता है. इन कैटगरी में, फ़ोटो में आम तौर पर दिखने वाली चीज़ों के बारे में बताया जाता है.
  • अपनी ज़रूरत के हिसाब से कस्टम मॉडल इस्तेमाल करें TensorFlow Hub से पहले से ट्रेन किए गए अन्य मॉडल या TensorFlow, AutoML या LiteRT से ट्रेन किया गया अपना कस्टम मॉडल इस्तेमाल करें.
  • इस्तेमाल में आसान हाई-लेवल एपीआई मॉडल के इनपुट/आउटपुट, इमेज की प्री-प्रोसेसिंग और पोस्ट-प्रोसेसिंग या प्रोसेसिंग पाइपलाइन बनाने के लिए, लो-लेवल एपीआई का इस्तेमाल करने की ज़रूरत नहीं होती. ML Kit, LiteRT मॉडल से लेबल निकालता है और उन्हें टेक्स्ट के तौर पर उपलब्ध कराता है.

ध्यान दें कि यह एपीआई, इमेज क्लासिफ़िकेशन मॉडल के लिए है. यह पूरी इमेज के बारे में बताता है. किसी इमेज में मौजूद एक या उससे ज़्यादा ऑब्जेक्ट, जैसे कि जूते या फ़र्नीचर के टुकड़ों को क्लासिफ़ाई करने के लिए, ऑब्जेक्ट का पता लगाने और उसे ट्रैक करने वाला एपीआई बेहतर हो सकता है.

इमेज क्लासिफ़िकेशन के लिए इस्तेमाल किए जा सकने वाले मॉडल

इमेज लेबलिंग एपीआई, इमेज क्लासिफ़िकेशन के अलग-अलग मॉडल के साथ काम करते हैं:

इमेज क्लासिफ़िकेशन के लिए इस्तेमाल किए जा सकने वाले मॉडल
बेस मॉडल एपीआई डिफ़ॉल्ट रूप से, इमेज को लेबल करने वाले एक ऐसे मॉडल का इस्तेमाल करता है जो सामान्य तौर पर काम करता है. यह मॉडल, 400 से ज़्यादा इकाइयों की पहचान कर सकता है. साथ ही, यह फ़ोटो में मौजूद सबसे सामान्य कॉन्सेप्ट को कवर करता है.
कस्टम LiteRT मॉडल ऐप्लिकेशन से जुड़े खास कॉन्सेप्ट को टारगेट करने के लिए, यह एपीआई अलग-अलग सोर्स से कस्टम इमेज क्लासिफ़िकेशन मॉडल स्वीकार करता है. ये पहले से ट्रेन किए गए मॉडल हो सकते हैं. इन्हें TensorFlow Hub से डाउनलोड किया जा सकता है. इसके अलावा, ये AutoML, LiteRT या TensorFlow की मदद से ट्रेन किए गए आपके अपने मॉडल भी हो सकते हैं. मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Cloud Storage के साथ होस्ट किया जा सकता है. साथ ही, रन-टाइम के दौरान डाउनलोड किया जा सकता है.

बेस मॉडल का इस्तेमाल करना

ML Kit का बेस मॉडल, लोगों, चीज़ों, जगहों, गतिविधियों वगैरह की पहचान करने वाली इकाइयों की सूची दिखाता है. हर इकाई के साथ एक स्कोर होता है. इससे पता चलता है कि एमएल मॉडल को उसकी अहमियत पर कितना भरोसा है. इस जानकारी की मदद से, मेटाडेटा अपने-आप जनरेट होने और कॉन्टेंट की निगरानी करने जैसे टास्क किए जा सकते हैं. ML Kit के साथ उपलब्ध डिफ़ॉल्ट मॉडल, 400 से ज़्यादा अलग-अलग इकाइयों की पहचान करता है.

iOS Android

लेबल के उदाहरण

इमेज लेबलिंग एपीआई में मौजूद बेस मॉडल, 400 से ज़्यादा लेबल के साथ काम करता है. जैसे, यहां दिए गए उदाहरण:

कैटगरीलेबल के उदाहरण
लोग Crowd
Selfie
Smile
गतिविधियां Dancing
Eating
Surfing
चीज़ें Car
Piano
Receipt
जानवर Bird
Cat
Dog
पौधे Flower
Fruit
Vegetable
जगहें Beach
Lake
Mountain

परिणामों के उदाहरण

यहां साथ में दी गई फ़ोटो में पहचानी गई इकाइयों का उदाहरण दिया गया है.

फ़ोटो: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
लेबल 0
टेक्स्ट स्टेडियम
कॉन्फ़िडेंस 0.9205354
लेबल 1
टेक्स्ट खेल
कॉन्फ़िडेंस 0.7531109
लेबल 2
टेक्स्ट इवेंट
कॉन्फ़िडेंस 0.66905296
लेबल 3
टेक्स्ट फ़ुर्सत के पल
कॉन्फ़िडेंस 0.59904146
लेबल 4
टेक्स्ट सॉकर
कॉन्फ़िडेंस 0.56384534
लेबल 5
टेक्स्ट कुल
कॉन्फ़िडेंस 0.54679185
लेबल 6
टेक्स्ट पौधा
कॉन्फ़िडेंस 0.524364

कस्टम LiteRT मॉडल का इस्तेमाल करना

ML Kit का इमेज लेबलिंग मॉडल, सामान्य इस्तेमाल के लिए बनाया गया है. इसे 400 कैटगरी की पहचान करने के लिए ट्रेन किया गया है. ये कैटगरी, फ़ोटो में सबसे ज़्यादा दिखने वाली चीज़ों के बारे में बताती हैं. आपके ऐप्लिकेशन को इमेज क्लासिफ़िकेशन के खास मॉडल की ज़रूरत पड़ सकती है. यह मॉडल, कम कैटगरी को ज़्यादा बारीकी से पहचानता है. जैसे, ऐसा मॉडल जो फूलों की प्रजातियों या खाने के टाइप के बीच अंतर करता है.

यह एपीआई, इस्तेमाल के किसी खास उदाहरण के हिसाब से बनाया जा सकता है. इसके लिए, यह अलग-अलग सोर्स से कस्टम इमेज क्लासिफ़िकेशन मॉडल इस्तेमाल करने की सुविधा देता है. ज़्यादा जानने के लिए, ML Kit के साथ कस्टम मॉडल देखें. कस्टम मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Cloud Storage से डाइनैमिक तौर पर डाउनलोड किया जा सकता है.

iOS Android

इनपुट इमेज की प्रीप्रोसेसिंग

ज़रूरत पड़ने पर, इमेज लेबलिंग की सुविधा, इमेज के साइज़ और आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) को अडजस्ट करने के लिए, इमेज को बड़ा करने और खींचने की बाइलिनियर तकनीक का इस्तेमाल करती है. इससे, इमेज को मॉडल की ज़रूरी शर्तों के मुताबिक बनाया जा सकता है.