لمحة عن هذا المستند
من خلال قراءة هذا المستند، سوف:
- تعرّف على الاستراتيجيات التي يجب إنشاؤها قبل إنشاء تقارير موجزة.
- يمكنك التعرّف على مختبر الضجيج، وهو أداة تساعد في إدراك تأثيرات معلَمات الضوضاء المختلفة، وتتيح استكشاف استراتيجيات متنوعة لإدارة الضوضاء وتقييمها بسرعة.
مشاركة ملاحظاتك
بينما يلخص هذا المستند بعض المبادئ للعمل على التقارير الموجزة، هناك أساليب متعددة لإدارة الضوضاء قد لا تنعكس هنا. نرحّب باقتراحاتك وإضافاتك وأسئلتك.
- لتقديم ملاحظات علنية حول استراتيجيات إدارة الضوضاء، يُرجى أو فائدة واجهة برمجة التطبيقات (epsilon)، ولمشاركة ملاحظاتك باستخدام مختبر الضوضاء: التعليق على هذه المشكلة
- لتقديم ملاحظات عامة حول Noise Lab (طرح سؤال أو الإبلاغ عن خطأ، طلب ميزة): إنشاء عدد جديد هنا
- لإرسال ملاحظات علنية حول جانب آخر من واجهة برمجة التطبيقات: إنشاء عدد جديد هنا
قبل البدء
- اقرأ تقارير تحديد المصدر: تقارير الملخص ونظرة عامة على النظام الكامل لإعداد تقارير تحديد المصدر للحصول على مقدمة لهذا الموضوع.
- عليك إجراء مسح ضوئي لكل من فهم الضجيج وفهم مفاتيح التجميع للاستفادة إلى أقصى حد من هذا الدليل.
قرارات التصميم
مبدأ التصميم الأساسي
هناك اختلافات أساسية بين آلية عمل ملفات تعريف الارتباط التابعة لجهات خارجية والتقارير الموجزة. هناك اختلاف رئيسي واحد هو الضوضاء المُضافة إلى بيانات القياس في التقارير التلخيصية. طريقة أخرى هي كيفية جدولة التقارير.
للوصول إلى بيانات قياس التقارير الموجزة باستخدام إشارات أعلى إلى تشويش والمنصّات على جانب الطلب (DSP) ومقدّمي خدمة قياس أداء الإعلانات إلى التعاون مع المعلنين لوضع استراتيجيات لإدارة الضجيج. لوضع هذه الاستراتيجيات، يحتاج مزودو خدمة البيانات ومزودو القياس إلى اتخاذ قرارات التصميم. تدور هذه القرارات حول مفهوم أساسي واحد:
في حين أنّ قيم الضوضاء يتم الحصول عليها في الأساس، تعتمد فقط على مَعلمتَين⏤إبسيلون وميزانية المساهمة⏤لديك عدد من عناصر التحكّم الأخرى تحت تصرفك وسيؤثر ذلك في نِسب الإشارة إلى الضوضاء لبيانات قياس المخرجات.
وبينما نتوقع أن تؤدي عملية تكرارية إلى أفضل القرارات، فإن كل اختلاف في هذه القرارات إلى تنفيذ مختلف قليلاً، وبالتالي يجب اتّخاذ هذه القرارات قبل كتابة كل تكرار للرمز (وقبل عرض الإعلانات).
القرار: دقة البُعد
جرِّبها في Noise Lab
- انتقِل إلى "الوضع المتقدّم".
- في لوحة "المَعلمات" الجانبية، ابحث عن بيانات الإحالات الناجحة.
- لاحظ المعلَمات التلقائية. بشكل افتراضي، تبلغ القيمة اليومية TOTAL عدد الإحالات الناجحة المنسوبة هو 1000. ويتراوح هذا المعدل إلى ما يقرب من 40 لكل إذا كنت تستخدم الإعداد الافتراضي (السمات التلقائية، والعدد التلقائي القيم المختلفة الممكنة لكل سمة، الاستراتيجية الرئيسية (أ). لاحظ أن القيمة هي 40 في الإدخال متوسط عدد الإحالات الناجحة القابلة للإحالة لكل حزمة.
- انقر على محاكاة لتشغيل محاكاة باستخدام المعلمات الافتراضية.
- في لوحة "المَعلمات" الجانبية، ابحث عن "السمات". إعادة تسمية الموقع الجغرافي إلى المدينة وغيِّر عدد القيم المختلفة المحتملة إلى 50.
- لاحِظ كيف يؤدي ذلك إلى تغيير متوسط الإحالات الناجحة المنسوبة اليومية. العد لكل حزمة. أصبح الطقس أقل بكثير الآن. هذا لأنه إذا قمت بزيادة عدد القيم المحتملة ضمن هذه السمة بدون تغيير أي شيء آخر، فإنك تزيد من إجمالي عدد المجموعات دون تغيير عدد أحداث الإحالات الناجحة التي ستقع في كل مجموعة
- انقر على "محاكاة".
- لاحِظ نِسب الضوضاء في عملية المحاكاة الناتجة: تكون نسب الضوضاء الآن أعلى من المحاكاة السابقة.
بالنظر إلى مبدأ التصميم الأساسي، من المرجح أن تكون قيم الملخص الصغيرة أكثر تشويشًا من قيم الملخص الكبيرة. لذلك، فإن خيارك للتهيئة يؤثّر في عدد أحداث الإحالات الناجحة المحدّدة المصدر التي تنتهي في كل مجموعة بيانات (وإلا باسم مفتاح التجميع)، كما تؤثر هذه الكمية على التشويش تقارير ملخص الناتج النهائي.
قرار تصميم واحد يؤثر في عدد أحداث الإحالات الناجحة المنسوبة داخل مجموعة واحدة هو دقّة البعد. ضع في اعتبارك الأمثلة التالية مفاتيح التجميع وأبعادها:
- الطريقة 1: بنية أساسية واحدة بأبعاد تقريبية: البلد x الحملة الإعلانية (أو أكبر حملة حزمة تجميع البيانات) x نوع المنتج (من أصل 10 أنواع منتجات محتمَلة)
- الطريقة 2: بنية أساسية واحدة بأبعاد دقيقة: المدينة x رقم تعريف تصميم الإعلان x المنتج (من إجمالي 100 منتج محتمل)
وتُعد المدينة سمة أكثر دقّة من سمة البلد. رقم تعريف تصميم الإعلان أكثر دقة من Campaign والمنتج أكثر دقة من نوع المنتج. ولذلك، سيتضمّن الطريقة 2 عددًا أقل من الأحداث (الإحالات الناجحة) لكل مجموعة بيانات (= لكل مجموعة بيانات) في مخرجات تقرير الملخص الخاص به من النهج 1. بالنظر إلى أن التشويش المضاف إلى يكون الناتج غير مرتبط بعدد الأحداث في الحزمة وبيانات القياس في تقارير الملخص ستكون أكثر تشويشًا باستخدام النهج 2. بالنسبة إلى كل معلن، جرب العديد من مفاضلات الدقة في تصميم المفتاح من أجل تحقيق أقصى فائدة في النتائج.
القرار: الهياكل الرئيسية
جرِّبها في Noise Lab
في الوضع البسيط، يتم استخدام بنية المفتاح الافتراضية. في Advanced يمكنك تجربة هياكل رئيسية مختلفة. بعض الأمثلة على السمات ؛ فيمكنك أيضًا تعديلها.
- انتقِل إلى "الوضع المتقدّم".
- في لوحة "المَعلمات" الجانبية، ابحث عن الاستراتيجية الرئيسية. الملاحظة أن الإستراتيجية التلقائية، المسماة A في الأداة، تستخدم مفتاحًا دقيقًا بنية تتضمّن جميع الأبعاد: الموقع الجغرافي × رقم تعريف الحملة × المنتج .
- انقر على "محاكاة".
- لاحِظ نِسب الضوضاء في المحاكاة الناتجة.
- قم بتغيير الإستراتيجية الرئيسية إلى B. يؤدي هذا إلى عرض عناصر تحكم إضافية لتتمكن من تكوين هيكل المفتاح.
- ضبط بنية المفاتيح، مثل على النحو التالي:
- عدد البُنى الأساسية: 2
- بنية المفتاح 1 = الموقع الجغرافي × فئة المنتج.
- بنية المفتاح 2 = رقم تعريف الحملة × فئة المنتج.
- انقر على "محاكاة".
- تجدر الإشارة إلى أنّك تحصل الآن على تقريرَين موجزَين لكل نوع من أهداف القياس (اثنتان لعدد عمليات الشراء، واثنتين لقيمة الشراء)، نظرًا لأنك تستخدم هيكلين رئيسيين متميزين. راقِب نِسب الضوضاء.
- يمكنك أيضًا تجربة ذلك باستخدام سماتك المخصّصة. للقيام بذلك، انظر للبيانات التي تريد تتبعها: الأبعاد. ننصحك بإزالة المثال. وإنشاء بنفسك باستخدام زر إضافة/إزالة/إعادة تعيين الأزرار أسفل البعد الأخير.
قرار تصميم آخر سيؤثر على عدد التحويل المنسوب والأحداث داخل مجموعة واحدة هي الهياكل الرئيسية تقرر استخدامها. يمكنك الاطّلاع على الأمثلة التالية لمفاتيح التجميع:
- بنية أساسية واحدة بجميع الأبعاد؛ ولنسم هذه الاستراتيجية الرئيسية "أ".
- بنيتان رئيسيتان، لكل منهما مجموعة فرعية من الأبعاد: دعونا نسمي هذا الاستراتيجية الأساسية ب.
الاستراتيجية أ أبسط، ولكن قد تحتاج إلى تجميع (مجموع) قيم الملخص الصاخبة التي تضمنت تقارير موجزة للوصول إلى إحصاءات معينة. من خلال تلخيص هذه القيم، فإنك أيضًا تلخص الضوضاء. باستخدام الإستراتيجية ب، يتم عرض قيم الملخص في الملخص المعلومات التي تحتاجها بالفعل. وهذا يعني أن الإستراتيجية ب من المحتمل أن تؤدي إلى نسب أفضل من الإشارة إلى التشويش مقارنة بالاستراتيجية أ. ومع ذلك، قد تكون الضوضاء مقبولة بالفعل مع الإستراتيجية أ، لذا لا يزال بإمكانك أن تقرر تفضيل الإستراتيجية أ لتبسيطها. اطّلِع على مزيد من المعلومات في المثال المفصّل الذي يوضّح هاتين الاستراتيجيتَين.
تعد إدارة المفاتيح موضوعًا عميقًا. يمكن صياغة عدد من الأساليب المعقدة لتحسين نسب الإشارة إلى الضوضاء. يتم وصف واحد في المفتاح المتقدم المشروع.
القرار: تكرار التجميع
جرِّبها في Noise Lab
- انتقل إلى الوضع البسيط (أو الوضع المتقدم — كلا الوضعين يعملان بالطريقة نفسها عندما يتعلق الأمر بتكرار التجميع)
- في لوحة "المَعلمات" الجانبية، ابحث عن استراتيجية التجميع >. معدّل تكرار التجميع ويشير هذا إلى تكرار تجميع التقارير القابلة للتجميع التي تتم معالجتها باستخدام خدمة التجميع في وظيفة واحدة.
- لاحظ معدل التكرار التلقائي للدفع: التجميع التلقائي يوميًا. تتم محاكاة التردد.
- انقر على "محاكاة".
- لاحِظ نِسب الضوضاء في المحاكاة الناتجة.
- يمكنك تغيير معدل تكرار التجميع إلى أسبوعي.
- لاحِظ نِسب الضوضاء في عملية المحاكاة الناتجة: تكون نسب الضوضاء الآن أقل (أفضل) مقارنة بالمحاكاة السابقة.
قرار تصميم آخر سيؤثر على عدد التحويل المنسوب الأحداث المُدرجة في حزمة واحدة هي معدّل تكرار التجميع الذي تقرر استخدامه. تشير رسالة الأشكال البيانية وهو عدد مرات معالجة التقارير القابلة للتجميع.
التقرير الذي تمت جدولته للتجميع مرات أكثر (على سبيل المثال كل ساعة) تتضمّن عددًا أقل من أحداث الإحالات الناجحة مقارنةً بالتقرير نفسه جدول التجميع (على سبيل المثال كل أسبوع). ونتيجةً لذلك، سيتضمّن التقرير كل ساعة المزيد من التشويش.``` تتضمّن عددًا أقل من أحداث الإحالات الناجحة مقارنةً بالتقرير نفسه جدول التجميع (على سبيل المثال كل أسبوع). ونتيجة لذلك، سيحتوي تقرير كل ساعة على انخفاض نسبة الإشارة إلى التشويش مقارنة بالتقرير الأسبوعي، وكل شيء آخر متساوية. أجرِ تجارب على متطلبات إعداد التقارير على ترددات مختلفة، وقيِّم نِسب الإشارة إلى الضوضاء لكل منها.
مزيد من المعلومات في التجميع والتجميع على مدار فترات زمنية أطول.
القرار: متغيّرات الحملة التي تؤثّر في الإحالات الناجحة التي يمكن تحديد مصدرها
جرِّبها في Noise Lab
وبينما قد يكون من الصعب التنبؤ بهذا الأمر ويمكن أن يكون له اختلافات كبيرة في بالإضافة إلى التأثيرات الموسمية، جرِّب تقدير عدد الضربات اليومية الإحالات الناجحة بلمسة واحدة المنسوبة إلى أقرب قوة 10: 10، 100 1000 أو 10000.
- انتقِل إلى "الوضع المتقدّم".
- في لوحة "المَعلمات" الجانبية، ابحث عن بيانات الإحالات الناجحة.
- لاحظ المعلَمات التلقائية. بشكل افتراضي، تبلغ القيمة اليومية TOTAL عدد الإحالات الناجحة المنسوبة هو 1000. ويتراوح هذا المعدل إلى ما يقرب من 40 لكل إذا كنت تستخدم الإعداد الافتراضي (السمات التلقائية، والعدد التلقائي القيم المختلفة الممكنة لكل سمة، الاستراتيجية الرئيسية (أ). لاحظ أن القيمة هي 40 في الإدخال متوسط عدد الإحالات الناجحة القابلة للإحالة لكل حزمة.
- انقر على محاكاة لتشغيل محاكاة باستخدام المعلمات الافتراضية.
- لاحِظ نِسب الضوضاء في المحاكاة الناتجة.
- يمكنك الآن ضبط TOTAL عدد الإحالات الناجحة المنسوبة اليومية على 100. يُرجى العلم أنّ هذا يؤدي إلى تقليل قيمة متوسط الأرباح اليومية المنسوبة عدد الإحالات الناجحة PER BUCKET.
- انقر على "محاكاة".
- لاحظ أن نسب الضوضاء أصبحت الآن أعلى: وذلك لأنه عندما لديهم إحالات ناجحة أقل لكل مجموعة، ويتم تطبيق المزيد من التشويش للحفاظ على الخصوصية.
هناك اختلاف مهم هو إجمالي عدد الإحالات الناجحة المحتملة المعلن، في مقابل إجمالي عدد الإحالات الناجحة المحتملة الناتجة عن تحديد المصدر. تشير رسالة الأشكال البيانية وهذا الأخير هو ما يؤثر في النهاية على التشويش في التقارير الموجزة. الإحالات الإحالات الناجحة هي مجموعة فرعية من إجمالي الإحالات الناجحة التي تكون متغيرات مثل ميزانية الإعلان واستهداف الإعلانات على سبيل المثال، يمكنك أن تتوقع زيادة في عدد الإحالات الناجحة المنسوبة لحملة إعلانية بقيمة 10 مليون دولار أمريكي مقابل إعلان بقيمة 10 آلاف دولار أمريكي الحملة، مع تكافؤ جميع العناصر الأخرى.
أمور تجب مراعاتها:
- تقييم الإحالات الناجحة المحدّدة المصدر بلمسة واحدة على الجهاز نفسه نموذج تحديد المصدر، لأنّ هذه الروابط تندرج ضمن نطاق التقارير التلخيصية التي يتم جمعها باستخدام Attribution Reporting API
- ضع في اعتبارك عدد أسوأ الحالات وعدد أفضل السيناريوهات للإحالات الناجحة المنسوبة. على سبيل المثال، إذا كانت جميع العناصر الأخرى متساوية، ضع في اعتبارك الحد الأدنى والأقصى لميزانيات حملة أحد المعلنين، ثم إحالات ناجحة يمكن إسنادها إلى المشروعين لكلتا النتيجتين كمدخلات في المحاكاة.
- إذا كنت تفكر في استخدام "مبادرة حماية الخصوصية" على Android مراعاة الإحالات الناجحة المنسوبة من عدّة منصات عند الاحتساب.
القرار: استخدام التحجيم
جرِّبها في Noise Lab
- انتقِل إلى "الوضع المتقدّم".
- في لوحة "المَعلمات" الجانبية، ابحث عن استراتيجية التجميع >. التوسعة. وقد تم ضبطها على "نعم" تلقائيًا.
- بهدف فهم الآثار الإيجابية للتوسع في نطاق الضوضاء ، فقم أولاً بتعيين التحجيم على "لا".
- انقر على "محاكاة".
- لاحِظ نِسب الضوضاء في المحاكاة الناتجة.
- اضبط تغيير الحجم على "نعم". لاحظ أن Noise Lab تحسبًا تلقائيًا عوامل التحجيم المراد استخدامها مع الأخذ في الاعتبار النطاقات (المتوسط والحد الأقصى للقيم) أهداف القياس للسيناريو الخاص بك. في نظام حقيقي أو مرحلة التجربة والتقييم الإعداد، فقد تحتاج إلى تنفيذ حساباتك الخاصة لعوامل التحجيم.
- انقر على "محاكاة".
- يُرجى ملاحظة أنّ نِسب الضوضاء أصبحت الآن أقل (أفضل) في هذه الثانية المحاكاة. هذا لأنك تستخدم التحجيم.
ووفقًا لمبدأ التصميم الأساسي، فإن مستوى التشويش المضاف يتم دالة لميزانية المساهمة.
وبالتالي، لزيادة نسب الإشارة إلى الضوضاء، يمكنك أن تقرر تحويل القيم التي تم جمعها خلال حدث إحالة ناجحة من خلال تحجيمها وفقًا ميزانية المساهمة (وتخفيض حجمها بعد التجميع). استخدِم التحجيم لزيادة نِسب الإشارة إلى التشويش.
القرار: عدد أهداف القياس وتقسيم ميزانية الخصوصية
ويرتبط هذا بالتحجيم؛ فتأكد من قراءة استخدام التحجيم.
جرِّبها في Noise Lab
هدف القياس هو نقطة بيانات مختلفة يتم جمعها في أحداث الإحالات الناجحة.
- انتقِل إلى "الوضع المتقدّم".
- في لوحة "المَعلمات" الجانبية، ابحث عن "البيانات" التي تريد تتبُّعها: أهداف القياس. لديك تلقائيًا هدفان لقياس الأداء: الشراء وعدد المشتريات.
- انقر على محاكاة لتشغيل محاكاة بالأهداف التلقائية.
- انقر على "إزالة". سيؤدي ذلك إلى إزالة هدف القياس الأخير (عملية الشراء). العد في هذه الحالة).
- انقر على "محاكاة".
- لاحِظ أنّ نِسب التشويش لقيمة الشراء أصبحت أقل الآن (أفضل) لهذه المحاكاة الثانية. هذا لأن لديك أقل والقياس؛ لذلك يحصل هدف القياس الآن على جميع ميزانية المساهمة.
- انقر على "إعادة ضبط". أصبح لديك الآن هدفان لقياس الأداء: الشراء وعدد المشتريات. لاحظ أن Noise Lab تحسبًا تلقائيًا معاملات التحجيم المراد استخدامها مع الأخذ في الاعتبار النطاقات (المتوسط والقيم القصوى) أهداف القياس للسيناريو الخاص بك. يعمل مختبر الضوضاء بشكل افتراضي على تقسيم الميزانية بالتساوي على مستوى أهداف القياس
- انقر على "محاكاة".
- لاحِظ نِسب الضوضاء في المحاكاة الناتجة. قم بتدوين والتحجيم المعروضة في المحاكاة.
- والآن، دعونا نخصّص تقسيم ميزانية الخصوصية لتحقيق نتائج نِسب الإشارة إلى الضوضاء.
- تعديل النسبة المئوية للميزانية المخصَّصة لكل هدف قياس وبالنظر إلى القيمة التلقائية للمعلَمات، فإن هدف القياس 1، وهو قيمة الشراء تحديدًا، نطاق أوسع (بين 0 و1000) من هدف القياس 2، أي عدد المشتريات (بين 1 و1، أي يساوي 1 دائمًا). بسبب يحتاج إلى "مساحة أكبر لتوسيع نطاقه": سيكون من المثالي تخصيص المزيد المساهمة في تحقيق هدف القياس 1 من هدف القياس 2، بحيث إمكانية التوسعة بشكل أكثر كفاءة (راجع التحجيم)، وبالتالي
- خصِّص 70% من الميزانية لهدف القياس 1. تخصيص% 30 للقياس الهدف 2.
- انقر على "محاكاة".
- لاحِظ نِسب الضوضاء في المحاكاة الناتجة. للشراء أصبحت نِسب التشويش الآن أقلّ بشكل ملحوظ (أفضل) مقارنةً بالفترة السابقة المحاكاة. وبالنسبة إلى عدد المشتريات، سيظل بدون تغيير تقريبًا.
- واصِل تعديل الميزانية على مستوى المقاييس المختلفة. لاحظ كيف يؤثر ذلك ضجيج
تجدر الإشارة إلى أنّه يمكنك تحديد أهداف القياس المخصّص باستخدام إضافة/إزالة/إعادة تعيين الأزرار.
في حال قياس نقطة بيانات واحدة (هدف قياس) في حدث إحالة ناجحة، مثل عدد الإحالات الناجحة، يمكن لنقطة البيانات هذه الحصول على ميزانية المساهمة بالكامل (65536). في حال ضبط أهداف قياس متعدّدة على حدث إحالة ناجحة، مثل عدد الإحالات الناجحة وقيمة الشراء، ستحتاج نقاط البيانات هذه إلى مشاركة ميزانية المساهمة. وهذا يعني أن لديك وقتًا أقل لتوسيع نطاق القيم.
وبالتالي، كلما زاد عدد أهداف القياس التي وضعتها، انخفضت نِسب الإشارة إلى التشويش. (ضوضاء أعلى).
هناك قرار آخر يجب اتخاذه بشأن أهداف القياس وهو تقسيم الميزانية. إذا قسمت ميزانية المساهمة بالتساوي على نقطتين من البيانات، ستحصل كل نقطة بيانات على ميزانية قدرها 65536/2 = 32768. قد يكون هذا أو لا يكون هو الأمثل اعتمادًا على أقصى قيمة ممكنة لكل نقطة بيانات. على سبيل المثال، إذا كنت تقيس عدد المشتريات الذي يبلغ الحد الأقصى للقيمة 1 وقيمة الشراء ذات 1 و120 كحد أقصى، ستستفيد قيمة الشراء من وجود "مساحة أكبر" زيادة - أي الحصول على نسبة أكبر من ميزانية المساهمة. سترى ما إذا كان يجب منح الأولوية لبعض أهداف القياس. على الآخرين فيما يتعلق بتأثير الضوضاء.
القرار: الإدارة الخارجية
جرِّبها في Noise Lab
هدف القياس هو نقطة بيانات مختلفة يتم جمعها في أحداث الإحالات الناجحة.
- انتقِل إلى "الوضع المتقدّم".
- في لوحة "المَعلمات" الجانبية، ابحث عن استراتيجية التجميع >. التوسعة.
- تأكَّد من ضبط تغيير الحجم على "نعم". يُرجى العلم أنّ ميزة Noise Lab بحساب عوامل القياس المراد استخدامها تلقائيًا، بناءً على النطاقات (المتوسط والحد الأقصى للقيم) التي قدمتها لأهداف القياس.
- لنفترض أن أكبر عملية شراء على الإطلاق كانت 2000 دولار، ولكن معظم عمليات الشراء تتم في نطاق 10-120 دولارًا. أولاً، لنرَ ما سيحدث إذا استخدمنا منهج التوسيع الحرفي (غير مستحسن): أدخل 2000 دولار كقيمة الحد الأقصى لقيمة purchaseValue.
- انقر على "محاكاة".
- لاحِظ أنّ نسب الضوضاء عالية. هذا لأن توسيع نطاق بناءً على 2000 دولار أمريكي (أو ما يعادله بالعملة المحلية)، في حين أن معظم تكون قيم الشراء أقل بشكل ملحوظ من ذلك
- والآن، لنستخدم منهجًا أكثر واقعية للتوسع. تغيير الحد الأقصى قيمة الشراء إلى 120 دولارًا.
- انقر على "محاكاة".
- لاحظ أن نسب الضوضاء أقل (أفضل) في عملية المحاكاة الثانية هذه.
لتطبيق التحجيم، عليك عادةً حساب عامل تحجيم استنادًا إلى أقصى قيمة ممكنة لحدث إحالة ناجحة معيّن (مزيد من المعلومات في هذا المثال)
مع ذلك، تجنَّب استخدام قيمة حرفية قصوى لحساب عامل القياس هذا، لأن ذلك من شأنه أن يؤدي إلى تفاقم نسب الإشارة إلى الضوضاء. بدلاً من ذلك، قم بإزالة القيم الاستثنائية استخدام قيمة قصوى عملية.
تُعد إدارة القيم الاستثنائية موضوعًا عميقًا. يمكن صياغة عدد من الأساليب المعقدة لتحسين نسب الإشارة إلى الضوضاء. يتم وصف واحد في الإدارة المتقدّمة للقيم الشاذّة
الخطوات التالية
والآن بعد أن قمت بتقييم إستراتيجيات إدارة الضوضاء المختلفة لحالة الاستخدام لديك، فأنت على استعداد لبدء تجربة التقارير الموجزة من خلال جمع بيانات القياس من خلال مرحلة التجربة والتقييم. راجِع الأدلة والنصائح لتجربة واجهة برمجة التطبيقات.
الملحق
جولة سريعة على "مختبر الضوضاء"
يساعدك Noise Lab في زيادة سرعة وتقييم ومقارنة استراتيجيات إدارة الضوضاء. يُستخدم من أجل:
- فهم المعاملات الرئيسية التي قد تؤثر في وظائف إخفاء هوية المستخدمين التأثير الذي يحدثه.
- محاكاة تأثير التشويش على بيانات قياس المخرجات المقدمة قرارات التصميم المختلفة. عدِّل معلمات التصميم حتى تصل إلى نسبة الإشارة إلى الضوضاء التي تناسب حالة استخدامك.
- شارك ملاحظاتك حول فائدة تقارير الملخص: قيم معاملَي إبسيلون والضوضاء، أيّها غير مناسب؟ أين يمكنني العثور على نقاط الانعطاف؟
فكر في هذا كخطوة تحضيرية. مختبر الضوضاء تُنشئ بيانات قياس لمحاكاة مخرجات التقارير الموجزة بناءً على إدخال. ولا يحتفظ بأي بيانات أو يشاركها.
هناك وضعان مختلفان في Noise Lab:
- الوضع البسيط: فهم أساسيات عناصر التحكّم المتوفّرة لديك على الضوضاء.
- الوضع المتقدّم: اختبِر استراتيجيات مختلفة لإدارة الضوضاء وقيِّمها. أيهما يؤدي إلى أفضل نسب الإشارة إلى التشويش لحالات استخدامك.
انقر على الزرّين في القائمة العلوية للتبديل بين الاثنين (#1. في لقطة الشاشة أدناه).
الوضع البسيط
- باستخدام الوضع البسيط، يمكنك التحكم في المعلمات (الموجودة على الجانب الأيسر) أو #2. في لقطة الشاشة أدناه) مثل Epsilon، ومعرفة مدى تأثيرها في التشويش.
- تحتوي كل مَعلمة على تلميح (زرّ "؟"). انقر على هذه للاطلاع على شرح لكل مَعلمة (رقم 3 في لقطة الشاشة أدناه)
- للبدء، انقر فوق الزر "محاكاة" وملاحظة ما يبدو عليه الإخراج مثل (#4. في لقطة الشاشة أدناه)
- في قسم الإخراج، يمكنك الاطلاع على مجموعة متنوعة من التفاصيل. بعض الإشعارات تحتوي العناصر على `?` بجواره. خذ الوقت الكافي للنقر على كل `؟` لعرض وشرحها لأجزاء مختلفة من المعلومات.
- داخل قسم Output (الإخراج)، انقر فوق مفتاح تبديل Details (التفاصيل) إذا كنت تريد مشاهدة نسخة موسّعة من الجدول (#5. في لقطة الشاشة أدناه)
- يوجد خيار أسفل كل جدول بيانات في قسم الإخراج لتنزيل الجدول للاستخدام بلا اتصال بالإنترنت. بالإضافة إلى ذلك، في الجزء السفلي في الجانب الأيسر، هناك خيار لتنزيل جميع جداول البيانات (#6. في لقطة الشاشة أدناه)
- اختبار إعدادات مختلفة للمعلَمات في قسم "المَعلمات" وانقر على "محاكاة" للاطّلاع على كيفية تأثيرها على الناتج:
الوضع المتقدم
- في الوضع المتقدّم، يمكنك التحكّم بشكل أكبر في المَعلمات. إِنْتَ إضافة أهداف القياس والسمات المخصّصة (#1. و2. في لقطة الشاشة أدناه)
- انتقل إلى الأسفل في قسم "المعلمات" وشاهد "المفتاح"
الاستراتيجية. ويمكن استخدامه لاختبار بُنى رئيسية مختلفة
(#3. في لقطة الشاشة أدناه)
- لاختبار بُنى أساسية مختلفة، بدِّل استراتيجية المفتاح إلى "B".
- أدخِل عدد بُنى المفاتيح المختلفة التي تريد استخدامها. (يتم ضبط القيمة التلقائية على "2")
- انقر على إنشاء بُنى أساسية
- ستظهر لك خيارات لتحديد بُنى المفاتيح عن طريق النقر على مربعات الاختيار بجوار المفاتيح التي تريد تضمينها لكل بنية مفتاح
- انقر على "محاكاة" للاطّلاع على المخرجات.
مقاييس الضوضاء
المفهوم الأساسي
تتم إضافة التشويش لحماية خصوصية المستخدم الفردي.
تشير قيمة التشويش العالي إلى أن المجموعات/المفاتيح متفرقة تحتوي على مساهمات من عدد محدود من الأحداث الحسّاسة. تم تلقائيًا بواسطة Noise Lab، للسماح للأفراد "بالإخفاء وسط الحشود"، أو في بعبارة أخرى، تحمي ممارسات هؤلاء الأشخاص المحدودين والخصوصية بقدر أكبر من التشويش الإضافي.
تشير قيمة التشويش المنخفض إلى أن إعداد البيانات قد تم تصميمه بطريقة تسمح للأفراد بالفعل "بالإخفاء وسط الحشود". وهذا يعني أن تحتوي الحِزم على مساهمات من عدد كافٍ من الأحداث لضمان حماية خصوصية المستخدم الفردي.
تنطبق هذه العبارة على كل من متوسط الخطأ بالنسبة المئوية (APE) وRMSRE_T (خطأ نسبي جذر متوسط مربع مع حد).
APE (متوسط الخطأ بالنسبة المئوية)
APE هي نسبة التشويش على الإشارة، وتحديدًا قيمة الملخص الحقيقية.p> وتعني قيم APE المنخفضة نسب أفضل للإشارة إلى التشويش.
الصيغة
بالنسبة إلى تقرير ملخّص معيَّن، يتم احتساب متوسط تكلفة النقرة (APE) على النحو التالي:
True هي قيمة الملخص الصحيحة. APE هو متوسط التشويش في كل القيمة الموجزة الحقيقية، التي تم حساب متوسطها على جميع الإدخالات في التقرير الملخص. وفي مختبر الضوضاء، يتم ضرب هذا بعد ذلك في 100 لمنح نسبة مئوية.
الإيجابيات والسلبيات
للدلاء ذات الأحجام الأصغر تأثير غير متناسب على القيمة النهائية لـ APE. قد يكون ذلك مضللاً عند تقييم الضوضاء. وهذا هو السبب في أننا أضفنا مقياسًا آخر، وهو RMSRE_T، مصمَّمًا للتخفيف من هذا القيد من APE. راجِع الأمثلة لمعرفة التفاصيل.
الرمز
راجِع رمز المصدر. لحساب APE.
RMSRE_T (خطأ نسبي لمربع جذر متوسط مع حد)
RMSRE_T (الخطأ النسبي النسبي للجذر المتوسط مع حد) هو مقياس آخر للتشويش.
كيفية تفسير RMSRE_T
تعني قيم RMSRE_T المنخفضة نسبًا أفضل من الإشارة إلى التشويش.
على سبيل المثال، إذا كانت نسبة التشويش المقبولة لحالة الاستخدام لديك هي 20%، بينما كانت قيمة RMSRE_T هي 0.2، يمكنك أن تثق في أن مستويات التشويش تندرج ضمن النطاق المقبول.
الصيغة
بالنسبة إلى تقرير ملخص معين، يتم حساب RMSRE_T على النحو التالي:
الإيجابيات والسلبيات
إنّ فهم RMSRE_T أكثر تعقيدًا من استيعاب APE. ومع ذلك، فإن هناك بعض المزايا التي تجعله في بعض الحالات أكثر ملاءمةً من APE لتحليل التشويش في التقارير الموجزة:
- قيمة RMSRE_T أكثر ثباتًا. "T" نقطة البداية. "T" تُستخدم لمنح ترجيح أقل في حساب RMSRE_T إلى المجموعات التي تحتوي على إحالات ناجحة أقل وبالتالي تكون أكثر حساسية للتشويش بسبب حجمها الصغير. عند استخدام T، لن يرتفع المقياس على الحِزم التي تتضمّن عددًا قليلاً من الإحالات الناجحة. إذا كانت T تساوي 5، لن يتم عرض قيمة تشويش صغيرة مثل 1 في مجموعة بيانات تحتوي على 0 إحالة ناجحة على أنّها أكثر من 1. بدلاً من ذلك، سيتم وضع حدّ أقصى لها يبلغ 0.2، أي ما يعادل 1/5، لأنّ T تساوي 5. ومن خلال منح مجموعات بيانات أصغر حجمًا تكون أكثر حساسية للتشويش، يكون هذا المقياس أكثر ثباتًا، وبالتالي يُسهِّل المقارنة بين عمليتي المحاكاة.
- تتيح RMSRE_T سهولة التجميع. تتيح لك معرفة RMSRE_T للمجموعات المتعددة، إلى جانب أعدادها الحقيقية، حساب RMSRE_T لإجماليها. ويسمح لك ذلك أيضًا بتحسين معدل RMSRE_T لهذه القيم المجمّعة.
وفي حين أن التجميع ممكن لـ APE، فإن المعادلة معقدة للغاية لأنها تتضمن القيمة المطلقة لمجموع ضوضاء لابلاس. وهذا يصعّب عملية تحسين APE.
الرمز
راجِع رمز المصدر لحساب RMSRE_T.
أمثلة
تقرير موجز بثلاث مجموعات:
- حزمة_1 = التشويش: 10, trueSummaryValue: 100
- bucket_2 = حزم: 20, trueSummaryValue: 100
- bucket_3 = Spam: 20, trueSummaryValue: 200
APE = (0.1 + 0.2 + 0.1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
تقرير موجز بثلاث مجموعات:
- حزمة_1 = التشويش: 10, trueSummaryValue: 100
- bucket_2 = حزم: 20, trueSummaryValue: 100
- bucket_3 = والإصدارات: 20، وtrueSummaryValue: 20
APE = (0.1 + 0.2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
تقرير موجز بثلاث مجموعات:
- حزمة_1 = التشويش: 10, trueSummaryValue: 100
- bucket_2 = حزم: 20, trueSummaryValue: 100
- bucket_3 = حزم: 20, trueSummaryValue: 0
APE = (0.1 + 0.2 + Infinity) / 3 = Infinity
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
الإدارة المتقدّمة للمفاتيح
قد يكون لدى أحد أنظمة وسيط عرض الطلب (DSP) أو شركة قياس أداء الإعلانات الآلاف من الإعلانات العالمية العملاء في صناعات وعملات متعددة وأسعار شراء وإمكانياته. وهذا يعني أن إنشاء مفتاح تجميع واحد وإدارته لكل غير عملي إلى حد كبير. بالإضافة إلى ذلك، سيكون الصعب تحديد الحد الأقصى للقيمة المجمعة وميزانية التجميع التي يمكن في الحدّ من تأثير التشويش على هؤلاء الآلاف من المعلنين حول العالم. بدلاً من ذلك، لنفكر في السيناريوهات التالية:
الاستراتيجية الرئيسية (أ)
لذلك يقرر مزود تقنية الإعلان إنشاء مفتاح واحد وإدارته في جميع عملاء الإعلان. وبالنسبة إلى جميع المعلنين وجميع العملات، فإن النطاق تتنوّع عمليات الشراء بين عمليات الشراء المنخفضة الحجم وعمليّات الشراء الراقية وعمليات الشراء ذات الأعداد الكبيرة من المنتجات المنخفضة التكلفة. عمليات الشراء. ينتج عن هذا المفتاح التالي:
مفتاح (عملات متعددة) | |
---|---|
الحد الأقصى للقيمة القابلة للتجميع | 5,000,000 |
نطاق قيمة الشراء | [120 - 5000000] |
الاستراتيجية الأساسية "ب"
لذلك يقرر مزود تقنية الإعلان إنشاء مفتاحين وإدارتهما عبر جميع عملاء الإعلان. يقررون فصل المفاتيح حسب العملة. على مستوى الكل المعلنين وجميع العملات، فإن نطاق عمليات الشراء يختلف من حجم صغير، من عمليات الشراء الراقية إلى المشتريات المنخفضة الحجم. مع الفصل حسب العملة، ينشئ مفتاحين:
المفتاح 1 (الدولار الأمريكي) | المفتاح 2 (≥) | |
---|---|---|
الحد الأقصى للقيمة القابلة للتجميع | 40000 دولار أمريكي | 5,000,000 ين ياباني |
نطاق قيمة الشراء | [من 120 إلى 40,000] | [من 15,000 إلى 5,000,000] |
ستكون نتائج الاستراتيجية الرئيسية "ب" أقل تشويشًا في نتائجها مقارنةً بالاستراتيجية الرئيسية "أ"، وذلك لأنّ لا يتم توزيع قيم العملات بشكل موحّد عبر العملات. على سبيل المثال: مراعاة كيفية التلامس بين عمليات الشراء المقسمة بالين ياباني مع المشتريات المقومة سيؤدي الدولار الأمريكي إلى تغيير البيانات الأساسية والمخرجات الصاخبة الناتجة عن ذلك.
الاستراتيجية الأساسية ج
لذلك يقرّر مزوّد تقنية الإعلان إنشاء وإدارة أربعة مفاتيح في جميع وعملائها الإعلانيين، وفصلهم حسب العملة × المعلن المجال:
المفتاح 1 (الدولار الأمريكي × المعلنين عن المجوهرات الراقية) |
المفتاح 2 (ين ياباني x المعلنين عن المجوهرات الراقية) |
المفتاح 3 (دولار أمريكي × معلنو تجزئة للملابس) |
المفتاح 4 (ين ياباني x معلنو بائعي التجزئة للملابس) |
|
---|---|---|---|---|
الحد الأقصى للقيمة القابلة للتجميع | 40000 دولار أمريكي | 5,000,000 ين ياباني | 500 دولار أمريكي | 65000 ين ياباني |
نطاق قيمة الشراء | [من 10,000 إلى 40,000] | [1,250,000 - 5,000,000] | [120 - 500] | [15,000 - 65,000] |
سيكون للاستراتيجية الرئيسية "ج" تشويش أقل في نتائجها مقارنةً بالاستراتيجية الرئيسية "ب"، لأن لا يتم توزيع قيم الشراء لدى المعلنين بشكل موحّد على مستوى المعلنين. بالنسبة على سبيل المثال، فكِّر في كيفية مزج شراء المجوهرات الراقية مع عمليات الشراء. البيانات الأساسية الناتجة عن الضربات الصاخبة.
ننصحك بإنشاء القيم المجمّعة القصوى المشتركة وعوامل القياس المشتركة القواسم المشتركة بين عدة معلنين بهدف تقليل التشويش في الإخراج. على سبيل المثال، يمكنك تجربة إستراتيجيات مختلفة أدناه المعلنين:
- استراتيجية واحدة مفصولة حسب العملة (دولار أمريكي أو ين ياباني أو دولار كندي أو غير ذلك)
- هناك استراتيجية واحدة مفصولة حسب مجال المعلِن ("التأمين" و"السيارات" البيع بالتجزئة وما إلى ذلك)
- استراتيجية واحدة مفصولة بنطاقات قيم شراء متشابهة ([100]، [1000] أو [10000] أو غير ذلك)
عن طريق إنشاء إستراتيجيات رئيسية حول القواسم المشتركة بين المعلنين والمفاتيح وتصبح إدارة التعليمة البرمجية المقابلة أسهل، وتصبح نسب الإشارة إلى الضوضاء أعلى. تجربة استراتيجيات مختلفة مع معلن مختلف القواسم المشتركة للكشف عن نقاط التحوّل في زيادة تأثير الضوضاء مقابل الترميز المشروع.
الإدارة المتقدّمة للقيم الشاذّة
لنأخذ في الاعتبار سيناريو على مستوى معلِنَين:
- المعلن أ:
- سعر الشراء في جميع المنتجات على موقع المعلن (أ) تتراوح الاحتمالات بين [120 و1,000 دولار]، لنطاق يتراوح من 880 دولارًا.
- يتم توزيع أسعار الشراء بالتساوي على نطاق 880 دولار أمريكي بدون قيم استثنائية خارج نطاقين معيارين من متوسط سعر الشراء.
- المعلن ب:
- سعر الشراء في جميع المنتجات على موقع المعلن (ب) تتراوح الاحتمالات بين [120 و1,000 دولار]، لنطاق يتراوح من 880 دولارًا.
- تتحول أسعار الشراء بشدة إلى نطاق يتراوح بين 120 و500 دولار أمريكي، مع حدوث 5% فقط من عمليات الشراء في نطاق يتراوح بين 500 و1000 دولار.
بناءً على متطلبات ميزانية المساهمة والمنهجية التي يتم بها تطبيق التشويش على النتائج النهائية، سيكون لدى المعلن ب بشكل افتراضي ناتج أكثر ضجيجًا من نظرًا إلى أن المعلن "ب" لديه احتمال أكبر بأن تؤثر القيم الاستثنائية في العمليات الحسابية الأساسية.
ومن الممكن الحد من هذا الخطأ باستخدام إعداد مفتاح محدد. اختبار الاستراتيجيات الرئيسية التي تساعد في إدارة البيانات الاستثنائية، وتوزيع قيم الشراء بالتساوي عبر نطاق شراء المفتاح.
بالنسبة إلى المعلن (ب)، يمكنك إنشاء مفتاحين منفصلين لتسجيل مفتاحين مختلفين نطاقات قيم الشراء. في هذا المثال، لاحظت تكنولوجيا الإعلان أنّ القيم الشاذّة تظهر فوق قيمة الشراء البالغة 500 دولار أمريكي حاول تنفيذ مفتاحين منفصلين هذا المعلن:
- بنية المفتاح 1 : مفتاح يجمع فقط عمليات الشراء بين نطاق يتراوح بين 120 و500 دولار أمريكي (ويغطي ما يقرب من 95% من إجمالي حجم عمليات الشراء).
- بنية المفتاح 2: مفتاح يجمع فقط عمليات الشراء التي تزيد عن 500 دولار أمريكي (أو ما يعادله بالعملة المحلية) (بما في ذلك% 5 تقريبًا من إجمالي حجم عمليات الشراء).
من المفترض أن يؤدي تنفيذ هذه الاستراتيجية الرئيسية إلى التخلص بشكل أفضل من تشويش المعلن (ب) المساعدة في تحقيق أقصى فائدة ممكنة لها من التقارير الموجزة. نظرًا للأصغر الجديد النطاقات، يجب أن يكون للمفتاح A والمفتاح B الآن توزيع أكثر اتساقًا للبيانات على كل مفتاح ذي صلة، وذلك للمفتاح الفردي السابق. سيؤدي هذا إلى تأثير أقل للتشويش في مخرجات كل مفتاح وذلك للمفتاح الفردي السابق.