ML Kit के GenAI API, Gemini Nano की मदद से आपके ऐप्लिकेशन को टास्क पूरे करने में मदद करते हैं. ये एपीआई, लोकप्रिय इस्तेमाल के उदाहरणों के लिए, बेहतर क्वालिटी उपलब्ध कराते हैं. इसके लिए, ये एक हाई-लेवल इंटरफ़ेस का इस्तेमाल करते हैं. ML Kit GenAI API, AICore पर बनाए गए हैं. यह Android सिस्टम सर्विस है. इससे, जनरेटिव एआई के बुनियादी मॉडल को डिवाइस पर ही लागू किया जा सकता है. इससे, ऐप्लिकेशन की बेहतर परफ़ॉर्मेंस और उपयोगकर्ता की निजता को बेहतर बनाने जैसी सुविधाओं को आसानी से उपलब्ध कराया जा सकता है. ऐसा, डेटा को स्थानीय तौर पर प्रोसेस करके किया जाता है.
GenAI API के इस्तेमाल पर, ML Kit GenAI API की सेवा की अन्य शर्तें लागू होती हैं. डेवलपर, अपने एपीआई क्लाइंट और ऐप्लिकेशन के उपयोगकर्ता अनुभव की सुरक्षा के लिए पूरी तरह से ज़िम्मेदार होते हैं.
मुख्य सुविधाएं
ML Kit के GenAI API में ये सुविधाएं काम करती हैं:
- खास जानकारी: लेखों या चैट की बातचीत की खास जानकारी को बुलेट वाली सूची के तौर पर दिखाओ.
- प्रूफ़रीडिंग: व्याकरण को बेहतर बनाकर और स्पेलिंग की गड़बड़ियों को ठीक करके, छोटे कॉन्टेंट को बेहतर बनाएं.
- मैसेज को फिर से लिखना: छोटे मैसेज को अलग-अलग टोन या स्टाइल में फिर से लिखें.
- इमेज के बारे में जानकारी: किसी इमेज के बारे में कम शब्दों में जानकारी जनरेट करें.
- आवाज़ को पहचानकर लिखाई में बदलने की सुविधा: ऑडियो कॉन्टेंट को टेक्स्ट में बदलता है.
- प्रॉम्प्ट: सिर्फ़ टेक्स्ट वाले कस्टम प्रॉम्प्ट या मल्टीमॉडल प्रॉम्प्ट के आधार पर टेक्स्ट कॉन्टेंट जनरेट करें.
GenAI API के फ़ायदे
मशीन लर्निंग किट की अन्य सुविधाओं की तरह, जेन एआई एपीआई पूरी तरह से डिवाइस पर काम करते हैं. इसलिए, इनके ये फ़ायदे हैं:
- इनपुट, अनुमान, और आउटपुट डेटा को स्थानीय तौर पर प्रोसेस किया जाता है
- इंटरनेट कनेक्शन ठीक न होने पर भी, सुविधा में कोई बदलाव नहीं होता
- हर एपीआई कॉल के लिए, सर्वर का कोई अतिरिक्त शुल्क नहीं लगता
इसके अलावा, GenAI API को AICore के आधार पर बनाया गया है और यह Gemini Nano की मदद से काम करता है. इसलिए, हर ऐप्लिकेशन, डिवाइस पर मौजूद शेयर किए गए Gemini Nano मॉडल का इस्तेमाल कर सकता है. अगर कोई मॉडल पहले से ही किसी डिवाइस पर मौजूद है, तो उसे डाउनलोड करने के लिए इंतज़ार करने की ज़रूरत नहीं होती. इससे स्टोरेज स्पेस भी बचता है. AICore, निजता की सुरक्षा के लिए अनुरोधों को अलग-अलग कैसे करता है, इसके बारे में ज़्यादा जानें.
स्ट्रीमिंग बनाम नॉन-स्ट्रीमिंग
ML Kit के GenAI API, नतीजे पाने के लिए स्ट्रीमिंग और बिना स्ट्रीमिंग वाले, दोनों विकल्प देते हैं. स्ट्रीमिंग एपीआई, जवाब जनरेट होने के साथ-साथ उन्हें डिलीवर करता है. इससे डेटा का लगातार फ़्लो मिलता है. इसके उलट, नॉन-स्ट्रीमिंग एपीआई, पूरे जवाब के तैयार होने का इंतज़ार करता है. इसके बाद, वह जवाब को एक ब्लॉक के तौर पर दिखाता है.
लंबे जवाबों के लिए स्ट्रीमिंग एपीआई चुनें, क्योंकि इससे शुरुआती फ़ीडबैक तुरंत मिल जाता है. नॉन-स्ट्रीमिंग एपीआई, छोटे जवाबों के लिए ज़्यादा सही है. इसके अलावा, यह तब भी सही है, जब नतीजों को बैच में प्रोसेस करना हो.
डिवाइस से जुड़ी सहायता
GenAI की सुविधा के हिसाब से बनाए गए एपीआई (खास जानकारी, स्पेलिंग और व्याकरण की जांच, फिर से लिखना, और इमेज का ब्यौरा) अलग-अलग डिवाइसों पर काम करते हैं. इस बारे में यहां बताया गया है.
सुविधा के हिसाब से, एपीआई के साथ काम करने वाले डिवाइस
जवाब की खास जानकारी, प्रूफरीडिंग, फिर से लिखना, और इमेज के बारे में जानकारी देने वाले एपीआई, इन डिवाइसों पर उपलब्ध हैं. आने वाले समय में, इन्हें अन्य डिवाइसों पर भी उपलब्ध कराया जाएगा:
- Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
- Honor: Honor 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro, Magic V5
- iQOO: iQOO 13, iQOO 15
- Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
- OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13, OnePlus 13s
- OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
- POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
- realme: realme GT 7 Pro, realme GT 7T
- Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold
- vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
- Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini
किसी खास भाषा में सहायता पाने की सुविधा, डिवाइस के कॉन्फ़िगरेशन और डिवाइस पर डाउनलोड किए गए मॉडल के हिसाब से अलग-अलग हो सकती है.
Prompt API के साथ काम करने वाले डिवाइस
Prompt API की सुविधा इन डिवाइसों पर उपलब्ध है:
nano-v2 |
|
nano-v3 |
|
Speech Recognition API के साथ काम करने वाले डिवाइस
Speech Recognition API की सुविधा, इन डिवाइसों पर काम करती है:
| बेसिक मोड | यह डिवाइस पर मौजूद स्पीच रिकग्निशन के पुराने मॉडल का इस्तेमाल करता है. यह मॉडल, एपीआई लेवल 31 और इसके बाद के वर्शन वाले ज़्यादातर Android डिवाइसों पर उपलब्ध है. |
|---|---|
| बेहतर मोड | यह बेहतर क्वालिटी और ज़्यादा भाषाओं में अनुवाद करने के लिए, जेन एआई मॉडल का इस्तेमाल करता है. यह सुविधा, Pixel 10 डिवाइसों पर काम करती है. साथ ही, इसे अन्य डिवाइसों के लिए भी उपलब्ध कराने पर काम किया जा रहा है. |
Gemini Nano का वर्शन वापस पाना
Gemini Nano के अलग-अलग वर्शन, अलग-अलग डिवाइसों पर काम करते हैं. किसी डिवाइस पर Gemini Nano के वर्शन को वापस लाने के लिए, getBaseModelName() का इस्तेमाल करें.
हर ऐप्लिकेशन के लिए कोटा
AICore, हर ऐप्लिकेशन के लिए अनुमान लगाने का कोटा लागू करता है. कम समय में GenAI API के बहुत ज़्यादा अनुरोध करने पर, आपको ErrorCode.BUSY जवाब मिलेगा. इस तरह की गड़बड़ी मिलने पर, अनुरोध को फिर से करने के लिए, एक्सपोनेंशियल बैकऑफ़ का इस्तेमाल करें. अगर कोई ऐप्लिकेशन, लंबी अवधि के कोटे (जैसे, रोज़ का कोटा) से ज़्यादा अनुरोध करता है, तो ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED को वापस भी किया जा सकता है.
बैकग्राउंड में इस्तेमाल
GenAI API का इस्तेमाल सिर्फ़ तब किया जा सकता है, जब ऐप्लिकेशन फ़ोरग्राउंड में सबसे ऊपर हो. जब ऐप्लिकेशन फ़ोरग्राउंड में नहीं होता है, तब एपीआई का इस्तेमाल करने पर ErrorCode.BACKGROUND_USE_BLOCKED रिस्पॉन्स मिलेगा. इसमें फ़ोरग्राउंड सेवा का इस्तेमाल करना भी शामिल है.
नमूना कोड
यह कोड पाने के लिए, यहां दिए गए सैंपल देखें: