ML Kit के GenAI API, Gemini Nano की मदद से आपके ऐप्लिकेशन को टास्क पूरे करने में मदद करते हैं. ये एपीआई, लोकप्रिय इस्तेमाल के उदाहरणों के लिए, बेहतर क्वालिटी उपलब्ध कराते हैं. इसके लिए, ये एक हाई-लेवल इंटरफ़ेस का इस्तेमाल करते हैं. ML Kit GenAI API, AICore पर बनाए गए हैं. यह Android सिस्टम की एक सेवा है. इसकी मदद से, डिवाइस पर GenAI के फ़ाउंडेशन मॉडल को लागू किया जा सकता है. इससे ऐप्लिकेशन की बेहतर सुविधाओं और उपयोगकर्ता की निजता को बेहतर बनाने में मदद मिलती है. ऐसा, डेटा को स्थानीय तौर पर प्रोसेस करके किया जाता है.
GenAI API के इस्तेमाल पर, ML Kit GenAI API की सेवा की अन्य शर्तें लागू होती हैं. डेवलपर, अपने एपीआई क्लाइंट और ऐप्लिकेशन के उपयोगकर्ता अनुभव की सुरक्षा के लिए पूरी तरह से ज़िम्मेदार होते हैं.
मुख्य सुविधाएं
ML Kit के GenAI API में ये सुविधाएं काम करती हैं:
- खास जानकारी: लेखों या चैट की बातचीत की खास जानकारी को बुलेट वाली सूची के तौर पर दिखाओ.
- प्रूफ़रीडिंग: व्याकरण को बेहतर बनाकर और स्पेलिंग की गड़बड़ियों को ठीक करके, छोटे कॉन्टेंट को बेहतर बनाएं.
- मैसेज को फिर से लिखना: छोटे मैसेज को अलग-अलग टोन या स्टाइल में फिर से लिखें.
- इमेज के बारे में जानकारी: दी गई इमेज के बारे में कम शब्दों में जानकारी जनरेट करें.
- बोली को पहचानकर लिखाई में बदलने की सुविधा: ऑडियो कॉन्टेंट को टेक्स्ट में बदलता है.
- प्रॉम्प्ट: सिर्फ़ टेक्स्ट वाले कस्टम प्रॉम्प्ट या मल्टीमॉडल प्रॉम्प्ट के आधार पर टेक्स्ट कॉन्टेंट जनरेट करें.
GenAI API के फ़ायदे
मशीन लर्निंग किट की अन्य सुविधाओं की तरह, जेन एआई एपीआई पूरी तरह से डिवाइस पर काम करते हैं. इसलिए, इनके ये फ़ायदे हैं:
- इनपुट, अनुमान, और आउटपुट डेटा को स्थानीय तौर पर प्रोसेस किया जाता है
- इंटरनेट कनेक्शन ठीक न होने पर भी, सुविधा में कोई बदलाव नहीं होता
- हर एपीआई कॉल के लिए, सर्वर का कोई अतिरिक्त शुल्क नहीं लगता
इसके अलावा, GenAI API को AICore के आधार पर बनाया गया है और यह Gemini Nano की मदद से काम करता है. इसलिए, हर ऐप्लिकेशन, डिवाइस पर मौजूद शेयर किए गए Gemini Nano मॉडल का इस्तेमाल कर सकता है. अगर कोई मॉडल पहले से ही किसी डिवाइस पर मौजूद है, तो उसे डाउनलोड करने के लिए इंतज़ार करने की ज़रूरत नहीं होती. इससे स्टोरेज स्पेस भी बचता है. AICore, निजता की सुरक्षा के लिए अनुरोधों को अलग-अलग कैसे करता है, इसके बारे में ज़्यादा जानें.
स्ट्रीमिंग और नॉन-स्ट्रीमिंग
ML Kit के GenAI API, नतीजे पाने के लिए स्ट्रीमिंग और नॉन-स्ट्रीमिंग, दोनों विकल्प देते हैं. स्ट्रीमिंग एपीआई, जवाब जनरेट होने के साथ-साथ उन्हें डिलीवर करता है. इससे डेटा का लगातार फ़्लो मिलता है. इसके उलट, नॉन-स्ट्रीमिंग एपीआई, पूरे जवाब के तैयार होने का इंतज़ार करता है. इसके बाद, वह जवाब को एक ब्लॉक के तौर पर दिखाता है.
लंबे जवाबों के लिए, स्ट्रीमिंग एपीआई चुनें. इससे शुरुआती फ़ीडबैक तुरंत मिल जाता है. नॉन-स्ट्रीमिंग एपीआई, छोटे जवाबों के लिए ज़्यादा सही है. इसके अलावा, यह बैच में नतीजों को प्रोसेस करने के लिए भी सही है.
डिवाइस से जुड़ी सहायता
GenAI की सुविधा के हिसाब से बनाए गए एपीआई (खास जानकारी, स्पेलिंग और व्याकरण की जांच, फिर से लिखना, और इमेज का ब्यौरा) अलग-अलग डिवाइसों पर काम करते हैं. हालांकि, प्रॉम्प्ट एपीआई अलग-अलग डिवाइसों पर काम करता है. इस बारे में यहां बताया गया है.
सुविधा के हिसाब से, एपीआई के साथ काम करने वाले डिवाइस
खास जानकारी, प्रूफरीडिंग, फिर से लिखना, और इमेज के बारे में जानकारी देने वाले एपीआई, इन डिवाइसों पर उपलब्ध हैं. साथ ही, इन्हें अन्य डिवाइसों पर भी उपलब्ध कराने के लिए काम किया जा रहा है:
- Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
- Honor: Honor 400 Pro, Magic 6 Pro, Magic 6 RSR, Magic 7, Magic 7 Pro, Magic V3, Magic V5
- iQOO: iQOO 13, iQOO 15
- Motorola: Razr 60 Ultra
- OnePlus: OnePlus 13, OnePlus 13s, OnePlus Pad 3
- OPPO: Find N5, Find X8, Find X8 Pro, Reno 14 Pro
- POCO: POCO F7 Ultra, POCO X7 Pro
- realme: realme GT 7 Pro, realme GT 7T
- Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy Z Fold7
- vivo: vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5
- Xiaomi: Xiaomi 15 Ultra, Xiaomi 15, Xiaomi 15T Pro, Xiaomi 15T, Xiaomi Pad Mini
किसी भाषा में सहायता पाने की सुविधा, डिवाइस के कॉन्फ़िगरेशन और डिवाइस पर डाउनलोड किए गए मॉडल के हिसाब से अलग-अलग हो सकती है.
Prompt API के साथ काम करने वाले डिवाइस
Prompt API की सुविधा इन डिवाइसों पर उपलब्ध है:
nano-v2 |
|
nano-v3 |
|
Speech Recognition API के साथ काम करने वाले डिवाइस
Speech Recognition API की सुविधा, इन डिवाइसों पर काम करती है:
| बेसिक मोड | यह डिवाइस पर मौजूद स्पीच रिकग्निशन के पुराने मॉडल का इस्तेमाल करता है. यह मॉडल, एपीआई लेवल 31 और इसके बाद के वर्शन वाले ज़्यादातर Android डिवाइसों पर उपलब्ध है. |
|---|---|
| बेहतर मोड | यह बेहतर क्वालिटी और ज़्यादा भाषाओं में अनुवाद करने के लिए, जेन एआई मॉडल का इस्तेमाल करता है. यह सुविधा, Pixel 10 डिवाइसों पर काम करती है. साथ ही, इसे अन्य डिवाइसों के लिए भी उपलब्ध कराने पर काम किया जा रहा है. |
Gemini Nano का वर्शन वापस पाना
Gemini Nano के अलग-अलग वर्शन, अलग-अलग डिवाइसों पर काम करते हैं. किसी डिवाइस पर Gemini Nano के वर्शन को वापस लाने के लिए, getBaseModelName() का इस्तेमाल करें.
हर ऐप्लिकेशन के लिए कोटा
AICore, हर ऐप्लिकेशन के लिए अनुमान लगाने का कोटा लागू करता है. कम समय में GenAI API के बहुत ज़्यादा अनुरोध करने पर, आपको ErrorCode.BUSY जवाब मिलेगा. इस तरह की गड़बड़ी मिलने पर, अनुरोध को फिर से करने के लिए, एक्सपोनेंशियल बैकऑफ़ का इस्तेमाल करें. अगर कोई ऐप्लिकेशन, लंबी अवधि के कोटे (जैसे, रोज़ का कोटा) से ज़्यादा अनुरोध करता है, तो ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED को वापस भी किया जा सकता है.
बैकग्राउंड में इस्तेमाल
GenAI API के अनुमान लगाने की सुविधा का इस्तेमाल सिर्फ़ तब किया जा सकता है, जब ऐप्लिकेशन टॉप फ़ोरग्राउंड ऐप्लिकेशन हो. जब ऐप्लिकेशन फ़ोरग्राउंड में न हो, तब एपीआई का इस्तेमाल करने पर ErrorCode.BACKGROUND_USE_BLOCKED रिस्पॉन्स मिलेगा. इसमें फ़ोरग्राउंड सेवा का इस्तेमाल करना भी शामिल है.
नमूना कोड
यह कोड पाने के लिए, यहां दिए गए सैंपल देखें: