Découvrez comment gérer le bruit dans vos rapports agrégables, en tenir compte et réduire l'impact.
Avant de commencer
Avant de continuer, pour comprendre en détail en quoi consiste le bruit et son impact, consultez Comprendre le bruit dans les rapports récapitulatifs.
Vos contrôles sur le bruit
Bien que vous ne puissiez pas contrôler directement le bruit ajouté à vos rapports agrégables, vous pouvez prendre certaines mesures pour en minimiser les effets. Les sections suivantes expliquent ces stratégies.
Ajuster en fonction du budget de contribution
Comme expliqué dans la section "Comprendre le bruit", le bruit appliqué à la valeur récapitulative de chaque clé est basé sur l'échelle 0-65 536 (0-CONTRIBUTION_BUDGET
).
Pour cette raison, afin d'optimiser le signal par rapport au bruit, vous devez augmenter la capacité de chaque valeur avant de la définir comme valeur agrégable, c'est-à-dire multiplier chaque valeur par un certain facteur, le facteur de mise à l'échelle, tout en respectant le budget de contribution.
Calculer un facteur de scaling
Le facteur de mise à l'échelle représente l'ampleur de la mise à l'échelle d'une valeur agrégable donnée. Sa valeur doit correspondre au budget de contribution divisé par la valeur agrégable maximale pour une clé donnée.
Supposons, par exemple, que les annonceurs souhaitent connaître la valeur totale des achats. Vous savez que la valeur d'achat maximale attendue d'un achat individuel est de 2 000 €, à l'exception de quelques valeurs aberrantes que vous décidez d'ignorer:
- Calculez le facteur de scaling:
<ph type="x-smartling-placeholder">
- </ph>
- Pour maximiser le rapport signal sur bruit, vous devez faire passer cette valeur à 65 536 (budget de contribution).
- Cela se traduit par un facteur de scaling de 65 536 / 2 000 d'environ 32x. En pratique, vous pouvez arrondir ce facteur à la hausse ou à la baisse.
- Augmentez la valeur de vos valeurs avant l'agrégation. Pour chaque $1 d'achat, incrémentez la métrique suivie de 32. Par exemple, pour un achat de 120 €, définissez une valeur agrégable de 120 x 32 = 3 840.
- Réduire la valeur de vos valeurs après l'agrégation. Une fois que vous avez reçu le rapport récapitulatif contenant la somme des valeurs des achats pour plusieurs utilisateurs, réduisez la valeur récapitulative à l'aide du facteur de mise à l'échelle que vous utilisiez avant l'agrégation. Dans notre exemple, nous avons utilisé un facteur de mise à l'échelle de 32 avant agrégation. Nous devons donc diviser la valeur récapitulative reçue dans le rapport récapitulatif par 32. Par conséquent, si la valeur d'achat récapitulative pour une clé donnée dans le rapport récapitulatif est de 76 800, la valeur d'achat récapitulative (avec bruit) est de 76 800/32, soit 2 400 $.
Diviser votre budget
Si vous avez plusieurs objectifs de mesure (nombre d'achats et valeur des achats, par exemple), vous pouvez répartir votre budget entre ces objectifs.
Dans ce cas, vos facteurs de scaling seront différents pour différentes valeurs agrégables, en fonction du maximum attendu d'une valeur agrégable donnée.
Pour en savoir plus, consultez Comprendre les clés d'agrégation.
Par exemple, supposons que vous effectuez le suivi du nombre et de la valeur des achats, et que vous décidiez de répartir votre budget de manière égale.
65 536 / 2 = 32 768 peuvent être alloués par type de mesure et par source.
- Nombre d'achats:
<ph type="x-smartling-placeholder">
- </ph>
- Vous ne suivez qu'un seul achat. Vous ne pouvez donc pas effectuer plus d'un achat pour une conversion donnée.
- Vous décidez donc de définir le facteur de scaling du nombre d'achats sur 32 768 / 1 = 32 768.
- Valeur des achats:
<ph type="x-smartling-placeholder">
- </ph>
- Supposons que la valeur d'achat maximale attendue d'un achat individuel soit de 2 000 €.
- Vous décidez donc de définir votre facteur de scaling pour la valeur des achats à 32 768 / 2 000 = 16,384, soit environ 16.
Des clés d'agrégation plus grossières améliorent le rapport signal/bruit
Étant donné que les clés approximatives détectent plus d'événements de conversion que les clés précises, elles génèrent généralement des valeurs récapitulatives plus élevées.
Les valeurs récapitulatives plus élevées sont moins affectées par le bruit que les valeurs inférieures. le bruit sur ces valeurs est susceptible d'être plus faible, par rapport à cette valeur.
Les valeurs collectées avec des clés plus grosses sont probablement moins bruyantes que les valeurs collectées avec des clés plus précises.
Exemple
Toutes choses égales par ailleurs, une clé qui suit la valeur des achats à l'échelle mondiale (additionnée dans tous les pays) générera une valeur d'achat récapitulative plus élevée (et un nombre de conversions récapitulatif plus élevé) qu'une clé qui suit les conversions au niveau d'un pays.
Par conséquent, le bruit relatif sur la valeur totale des achats pour un pays spécifique sera plus élevé que sur la valeur totale des achats pour tous les pays.
De même, si tous les autres sont identiques, la valeur totale des achats de chaussures est inférieure à la valeur totale des achats de tous les articles (y compris les chaussures).
Par conséquent, le bruit relatif sur la valeur totale des achats de chaussures sera plus élevé que sur la valeur totale des achats pour tous les articles.
La somme des valeurs récapitulatives (cumuls) additionne aussi leurs bruits
En additionnant les valeurs récapitulatives des rapports de synthèse pour accéder à des données de niveau supérieur, vous additionnez également le bruit de ces valeurs récapitulatives.
Examinons deux approches différentes: - Méthode A: vous incluez un ID de zone géographique dans vos clés. Les rapports de synthèse exposent des clés au niveau de l'ID géographique, chacune associée à la valeur d'achat récapitulative au niveau d'un ID géographique spécifique. - Méthode B: n'incluez pas d'ID géographique dans vos clés. Les rapports de synthèse indiquent directement la valeur d'achat récapitulative pour tous les ID / zones géographiques.
Pour connaître la valeur des achats au niveau d'un pays: - Avec l'approche A, vous additionnez les valeurs récapitulatives au niveau de l'ID géographique et, par conséquent, leur bruit. Cela entraînera probablement davantage de bruit ajouté à la valeur d'achat finale au niveau de l'ID géographique. - L'approche B consiste à examiner directement les données présentées dans les rapports récapitulatifs. Le bruit n'a été ajouté qu'une seule fois à ces données.
Par conséquent, la valeur d'achat récapitulative pour un ID géographique donné est susceptible de générer plus de bruit avec l'approche A.
De même, l'ajout d'une dimension au niveau du code postal dans vos clés générera probablement des résultats plus bruyants que l'utilisation de clés plus grosses avec une dimension au niveau de la région.
L'agrégation sur de plus longues périodes augmente le rapport signal/bruit.
Le fait de demander des rapports de synthèse moins souvent signifie que chaque valeur récapitulative sera probablement plus élevée que si vous avez demandé des rapports plus souvent. davantage de conversions sont susceptibles de se produire sur des périodes plus longues.
Comme indiqué précédemment, plus la valeur récapitulative est élevée, plus le bruit relatif est susceptible d'être faible. Par conséquent, demander des rapports récapitulatifs moins fréquemment génère un rapport signal/bruit plus élevé (meilleur).
Voici un exemple:
- Si vous demandez des rapports récapitulatifs horaires sur une période de 24 heures, puis que vous additionnez la valeur récapitulative de chaque rapport horaire pour accéder aux données au niveau de la journée, le bruit est ajouté 24 fois.
- Dans un rapport récapitulatif quotidien, le bruit n'est ajouté qu'une seule fois.
Valeur epsilon plus élevée, bruit plus faible
Plus la valeur epsilon est élevée, plus le bruit et la protection de la confidentialité sont faibles.
Exploiter le filtrage et la déduplication
Pour répartir le budget entre différentes clés, il est important de comprendre combien de fois un événement donné peut se produire. Par exemple, un annonceur peut s'intéresser à un seul achat par clic, mais peut être intéressé par jusqu'à trois "pages vues du produit". des conversions. Pour prendre en charge ces cas d'utilisation, vous pouvez également exploiter les fonctionnalités d'API suivantes, qui vous permettent de contrôler le nombre de rapports générés et les conversions comptabilisées:
- Filtrage : En savoir plus sur le filtrage
- Déduplication. En savoir plus sur la déduplication
Effectuer des tests avec la valeur epsilon
Les technologies publicitaires peuvent définir la valeur epsilon sur une valeur supérieure à 0 et jusqu'à 64 (inclus). Cette plage permet de réaliser des tests flexibles. Les valeurs inférieures de la valeur epsilon offrent une meilleure protection de la confidentialité. Nous vous recommandons de commencer par epsilon=10.
Recommandations à tester
Nous vous recommandons de suivre les conseils suivants: : commencez par epsilon = 10. - Si cela provoque des problèmes d'énergie importants, augmentez progressivement la valeur epsilon. - Faites part de vos commentaires sur les points d’inflexion spécifiques que vous pourriez trouver en ce qui concerne la facilité d’utilisation des données.
Interagir et partager des commentaires
Vous pouvez participer et tester cette API.
- Découvrez les rapports agrégables et le service d'agrégation, posez des questions et suggérez des commentaires.
- Consultez les guides sur l'attribution de rapports.
- Posez des questions et participez à des discussions dans le dépôt de l'assistance Privacy Sandbox pour les développeurs.
Étapes suivantes
- Pour en savoir plus sur les facteurs qui influencent la création de rapports, tels que les variables de campagne, la fréquence de traitement par lot et la précision des dimensions, consultez Tester en prenant des décisions concernant la conception des rapports récapitulatifs .
- Essayez Noise Lab.