अपनी इकट्ठा की जा सकने वाली रिपोर्ट में गै़र-ज़रूरी डेटा के साथ काम करने, उसका हिसाब लगाने, और उसके असर को कम करने का तरीका जानें.
शुरू करने से पहले
आगे बढ़ने से पहले, शोर क्या है और इसके असर को गहराई से समझने के लिए, खास जानकारी वाली रिपोर्ट में शोर को समझना देखें.
शोर पर आपके कंट्रोल
हालांकि, एग्रीगेट की जा सकने वाली रिपोर्ट में आने वाले शोर को सीधे तौर पर कंट्रोल नहीं किया जा सकता. हालांकि, इस तरह के असर को कम करने के लिए, कुछ तरीके आज़माए जा सकते हैं. इन सेक्शन में, इन रणनीतियों के बारे में बताया गया है.
योगदान के बजट तक बढ़ाएं
जैसा कि 'शोर को समझना' सेक्शन में बताया गया है, हर कुंजी के लिए, समरी वैल्यू पर लागू होने वाला शोर 0-65,536 स्केल (0-CONTRIBUTION_BUDGET
) के आधार पर तय होता है.
इसलिए, शोर से जुड़े सिग्नल को ज़्यादा से ज़्यादा बढ़ाने के लिए, आपको हर वैल्यू को एग्रीगेट वैल्यू के तौर पर सेट करने से पहले स्केल अप करना होगा. इसका मतलब है कि हर वैल्यू को किसी खास फ़ैक्टर, स्केलिंग फ़ैक्टर से गुणा करना चाहिए. साथ ही, यह पक्का करना होगा कि वह योगदान के लिए तय किए गए बजट में बनी रहे.
स्केलिंग फ़ैक्टर को कैलकुलेट किया जा रहा है
स्केलिंग फ़ैक्टर से यह पता चलता है कि आपको इकट्ठा की जा सकने वाली किसी वैल्यू को कितना स्केल करना है. इसका मान योगदान बजट को किसी खास कुंजी के लिए सबसे ज़्यादा एग्रीगेट किए जा सकने वाले मान से भाग देने पर मिलने वाला होना चाहिए.
उदाहरण के लिए, मान लें कि विज्ञापन देने वाले लोग खरीदारी की कुल कीमत जानना चाहते हैं. आपको पता है कि किसी एक खरीदारी का ज़्यादा से ज़्यादा 2,000 डॉलर का अनुमान लगाया जा सकता है. हालांकि, कुछ बाहरी वजहों को अनदेखा किया जा सकता है:
- स्केलिंग फ़ैक्टर का आकलन करें:
- सिग्नल-शोर अनुपात को ज़्यादा से ज़्यादा बढ़ाने के लिए, आपको इस वैल्यू को 65,536 (योगदान के लिए बजट) पर सेट करना होगा.
- इसका नतीजा यह होता है कि स्केलिंग फ़ैक्टर 65,536 / 2,000 हो सकता है. यह करीब 32x होता है. व्यावहारिक तौर पर, इस फ़ैक्टर को कम या ज़्यादा किया जा सकता है.
- एग्रीगेशन से पहले अपनी वैल्यू को बढ़ाएं. हर 1 डॉलर की खरीदारी के लिए, ट्रैक की गई मेट्रिक को 32 तक बढ़ाएं. उदाहरण के लिए, 120 डॉलर की खरीदारी के लिए, 120*32 = 3,840 की एग्रीगेट वैल्यू सेट करें.
- एग्रीगेशन के बाद, वैल्यू को छोटा करें. जब आपको खास जानकारी वाली ऐसी रिपोर्ट मिलती है जिसमें कई उपयोगकर्ताओं के बीच परचेज़ कन्वर्ज़न की कुल वैल्यू शामिल होती है, तो एग्रीगेशन से पहले इस्तेमाल किए गए स्केलिंग फ़ैक्टर का इस्तेमाल करके, खास जानकारी वाली वैल्यू को स्केल करें. इस उदाहरण में, हमने प्री-एग्रीगेशन के लिए 32 स्केलिंग फ़ैक्टर का इस्तेमाल किया है. इसलिए, हमें खास जानकारी वाली रिपोर्ट में मिली खास जानकारी की वैल्यू को 32 से भाग देना होगा. इसलिए, अगर समरी रिपोर्ट में किसी कुंजी की समरी परचेज़ वैल्यू 76,800 है, तो समरी परचेज़ वैल्यू (जो शोर के साथ) 76,800/32 = 2,400 डॉलर होगी.
अपना बजट बांटें
अगर आपके पास खरीदारी की संख्या और परचेज़ वैल्यू जैसे कई मेज़रमेंट लक्ष्य हैं, तो आपको अपना बजट इन सभी लक्ष्यों के हिसाब से बांटना होगा.
इस मामले में, एग्रीगेट की जा सकने वाली अलग-अलग वैल्यू के लिए स्केलिंग फ़ैक्टर अलग-अलग होंगे.
ज़्यादा जानकारी के लिए, एग्रीगेशन कुंजियों को समझना लेख पढ़ें.
उदाहरण के लिए, मान लें कि आप खरीदारी की संख्या और परचेज़ वैल्यू, दोनों को ट्रैक कर रहे हैं और आपने अपना बजट बराबर-बराबर बांटा है.
65,536 / 2 = 32,768 को हर मेज़रमेंट टाइप और हर सोर्स के हिसाब से बांटा जा सकता है.
- खरीदारी की संख्या:
- आप सिर्फ़ एक खरीदारी ट्रैक कर रहे हैं, इसलिए किसी कन्वर्ज़न के लिए खरीदारी की ज़्यादा से ज़्यादा संख्या एक है.
- इसलिए, खरीदारी की संख्या के लिए स्केलिंग फ़ैक्टर को 32,768 / 1 = 32,768 पर सेट करें.
- परचेज़ कन्वर्ज़न का कुल मान:
- मान लें कि किसी एक खरीदारी की ज़्यादा से ज़्यादा अनुमानित खरीदारी वैल्यू 2,000 डॉलर है.
- इसलिए, परचेज़ वैल्यू के लिए स्केलिंग फ़ैक्टर को 32,768 / 2,000 = 16.384 या करीब 16 पर सेट करने का फ़ैसला लिया जाता है.
सामान्य एग्रीगेशन कुंजियों की मदद से, सिग्नल-शोर का अनुपात बेहतर होता है
ज़्यादा जानकारी वाली कुंजियों के मुकाबले, सामान्य कुंजियों के मुकाबले ज़्यादा कन्वर्ज़न इवेंट पकते हैं. इसलिए, सामान्य कुंजियों से आम तौर पर खास जानकारी वाली वैल्यू ज़्यादा होती है.
कम वैल्यू के मुकाबले, ज़्यादा जानकारी वाली वैल्यू पर नॉइज़ का कम असर होता है. इस वैल्यू के मुकाबले, इन वैल्यू में गै़र-ज़रूरी डेटा कम हो सकता है.
ज़्यादा जानकारी वाली कुंजियों के साथ इकट्ठा की गई वैल्यू के मुकाबले, तेज़ कुंजी की मदद से इकट्ठा की जाने वाली वैल्यू में कम शोर होता है.
उदाहरण
बाकी सब चीज़ों को एक जैसा रखा जाता है. ऐसी कुंजी जो दुनिया भर में परचेज़ कन्वर्ज़न को ट्रैक करती है (सभी देशों में जोड़ी जाती है) से, देश के लेवल पर कन्वर्ज़न ट्रैक करने वाली कुंजी के मुकाबले, खास जानकारी वाली परचेज़ वैल्यू के साथ-साथ कन्वर्ज़न की संख्या भी ज़्यादा होगी.
इसलिए, किसी खास देश में प्रॉडक्ट की कुल खरीदारी की वैल्यू, सभी देशों में प्रॉडक्ट खरीदने की कुल वैल्यू के मुकाबले ज़्यादा होगी.
इसी तरह, बाकी सभी चीज़ों को एक जैसा रखा जाता है. इस वजह से, जूतों की कुल वैल्यू, सभी प्रॉडक्ट (इसमें जूते भी शामिल हैं) की कुल परचेज़ वैल्यू से कम होती है.
इसलिए, जूतों की कुल खरीदारी की वैल्यू के मुकाबले सभी आइटम की कुल परचेज़ वैल्यू की तुलना में ज़्यादा होगा.
समरी वैल्यू (रोलअप) को जोड़ने पर, डेटा में मौजूद गै़र-ज़रूरी डेटा का कुल योग भी पता चलता है
समरी रिपोर्ट में मौजूद खास जानकारी की वैल्यू को जोड़ कर, हाई-लेवल डेटा को ऐक्सेस किया जा सकता है. इससे, खास जानकारी वाले डेटा का कुल डेटा भी इकट्ठा किया जा सकता है.
आइए दो अलग-अलग तरीकों पर नज़र डालते हैं: - अप्रोच A: अपनी कुंजियों में भूगोल आईडी शामिल करें. खास जानकारी वाली रिपोर्ट में, जियो-आईडी-लेवल की कुंजियां दिखाई जाती हैं. हर कुंजी, किसी खास भौगोलिक आईडी के लेवल पर खास जानकारी की खरीदारी की वैल्यू से जुड़ी होती है. - अप्रोच B: आपने अपनी कुंजियों में भौगोलिक आईडी शामिल नहीं किया है. खास जानकारी वाली रिपोर्ट में, सभी भौगोलिक आईडी / जगहों के लिए खरीदारी की खास जानकारी की जानकारी दिखती है.
देश के लेवल पर खरीदारी की वैल्यू को ऐक्सेस करने के लिए: - अप्रोच A का इस्तेमाल करके, जियो-आईडी-लेवल की समरी वैल्यू जोड़ी जाती हैं. इस तरह, वैल्यू को जोड़कर देखा जा सकता है. इससे, भौगोलिक आईडी के लेवल पर की गई खरीदारी की वैल्यू में ज़्यादा ग़ैर-ज़रूरी गड़बड़ियां हो सकती हैं. - अप्रोच B में, खास जानकारी वाली रिपोर्ट में दिखाए गए डेटा को सीधे तौर पर देखा जा सकता है. इस डेटा में ग़ैर-ज़रूरी आवाज़ों को सिर्फ़ एक बार जोड़ा गया है.
इसलिए, A का इस्तेमाल करने पर, किसी खास भौगोलिक आईडी की खास जानकारी वाली परचेज़ वैल्यू में शोर हो सकता है.
इसी तरह, अपनी कुंजियों में पिन कोड-लेवल डाइमेंशन शामिल करने से, क्षेत्र-लेवल के डाइमेंशन के साथ अस्पष्ट कुंजियों का इस्तेमाल करने की तुलना में ज़्यादा ग़ैर-ज़रूरी नतीजे मिल सकते हैं.
लंबे समय तक एग्रीगेट करने से, सिग्नल-शोर का अनुपात बढ़ता है
खास जानकारी वाली रिपोर्ट के लिए कम अनुरोध करने का मतलब है कि अगर आपने रिपोर्ट के लिए ज़्यादा अनुरोध किया है, तो इस रिपोर्ट की हर वैल्यू ज़्यादा हो सकती है. लंबे समय में ज़्यादा कन्वर्ज़न होने की संभावना बढ़ जाती है.
जैसा कि पहले बताया गया है, समरी वैल्यू जितनी ज़्यादा होगी, रिलेटिव नॉइज़ की संभावना उतनी ही कम होगी. इसलिए, जब खास जानकारी वाली रिपोर्ट का अनुरोध कम बार किया जाता है, तो शोर का अनुपात ज़्यादा (बेहतर) सिग्नल मिलता है.
यह दिखाने के लिए यहां एक उदाहरण दिया गया है:
- अगर आपको 24 घंटे से ज़्यादा के लिए हर घंटे की खास जानकारी वाली रिपोर्ट का अनुरोध करना है और इसके बाद दिन-लेवल का डेटा ऐक्सेस करने के लिए, हर घंटे की रिपोर्ट से खास जानकारी की वैल्यू को जोड़ना है, तो गै़र-ज़रूरी डेटा को 24 बार जोड़ा जाता है.
- हर दिन की खास जानकारी वाली एक रिपोर्ट में, ग़ैर-ज़रूरी आवाज़ों को सिर्फ़ एक बार शामिल किया जाता है.
ज़्यादा ऐपसिलॉन, कम शोर
Epsilon की वैल्यू जितनी ज़्यादा होगी, शोर उतना ही कम होगा. साथ ही, निजता सुरक्षा भी कम होगी.
फ़िल्टर करने और डुप्लीकेट कॉपी हटाने की सुविधा का इस्तेमाल करना
अलग-अलग कुंजियों के बीच बजट तय करने का एक अहम हिस्सा यह समझना है कि कोई इवेंट कितनी बार हो सकता है. उदाहरण के लिए, हो सकता है कि कोई विज्ञापन देने वाला हर क्लिक के लिए सिर्फ़ एक खरीदारी पर ध्यान दे, लेकिन उसकी दिलचस्पी ज़्यादा से ज़्यादा तीन "प्रॉडक्ट पेज व्यू" कन्वर्ज़न में हो. इस्तेमाल के इन उदाहरणों में बेहतर तरीके से काम करने के लिए, एपीआई की इन सुविधाओं का भी फ़ायदा लिया जा सकता है. इनकी मदद से, यह कंट्रोल किया जा सकता है कि कितनी रिपोर्ट जनरेट हों और कौनसे कन्वर्ज़न की गिनती की जाए:
- फ़िल्टर करना. फ़िल्टर करने के बारे में ज़्यादा पढ़ें.
- डुप्लीकेट कॉपी हटाने की तकनीक. डुप्लीकेट कॉपी हटाने के बारे में ज़्यादा जानें.
Epsilon के साथ प्रयोग करना
विज्ञापन टेक्नोलॉजी की मदद से, किसी भी ऐप्लिकेशन को 0 से ज़्यादा की वैल्यू पर सेट किया जा सकता है. साथ ही, 64 या इससे ज़्यादा की वैल्यू भी सेट की जा सकती है. इस रेंज में, ज़रूरत के हिसाब से जांच करने की सुविधा मिलती है. Epsilon के कम मान से ज़्यादा निजता सुरक्षा मिलती है. हमारा सुझाव है कि आप epsilon=10 से शुरू करें.
प्रयोग के लिए सुझाव
हमारा सुझाव है कि आप: - Epsilon से शुरू करें = 10. - अगर इससे बिजली, पानी जैसी सुविधाओं से जुड़ी अहम समस्याएं पैदा होती हैं, तो Epsilon को धीरे-धीरे बढ़ाएं. - डेटा के इस्तेमाल के बारे में सुझाव, राय या शिकायत भेजने के लिए, ज़रूरत के हिसाब से कुछ बदलाव करें.
लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें
आपके पास इस एपीआई में हिस्सा लेने और इसका इस्तेमाल करने का विकल्प है.
- एग्रीगेट करने लायक रिपोर्ट और एग्रीगेशन सेवा के बारे में पढ़ें, सवाल पूछें, और सुझाव दें.
- एट्रिब्यूशन रिपोर्टिंग गाइड पढ़ें.
- प्राइवसी सैंडबॉक्स डेवलपर सहायता रेपो पर सवाल पूछें और होने वाली चर्चाओं में शामिल हों.
अगले चरण
- रिपोर्टिंग पर असर डालने वाली वजहों, जैसे कि कैंपेन वैरिएबल, बैचिंग फ़्रीक्वेंसी, और डाइमेंशन की ज़्यादा जानकारी के लिए, खास जानकारी वाली रिपोर्ट को डिज़ाइन करने से जुड़े फ़ैसलों के साथ प्रयोग करना लेख पढ़ें .
- शोर लैब आज़माएं.