Travailler avec le bruit

Découvrez comment gérer le bruit dans vos rapports agrégables, en tenir compte et réduire l'impact.

Avant de commencer

Avant de continuer, pour comprendre en détail en quoi consiste le bruit et son impact, consultez Comprendre le bruit dans les rapports récapitulatifs.

Vos contrôles sur le bruit

Bien que vous ne puissiez pas contrôler directement le bruit ajouté à vos rapports agrégables, vous pouvez prendre certaines mesures pour en minimiser les effets. Les sections suivantes expliquent ces stratégies.

Ajuster en fonction du budget de contribution

Comme expliqué dans la section "Comprendre le bruit", le bruit appliqué à la valeur récapitulative de chaque clé est basé sur l'échelle 0-65 536 (0-CONTRIBUTION_BUDGET).

La répartition du bruit est basée sur le budget.

Pour cette raison, afin d'optimiser le signal par rapport au bruit, vous devez augmenter la capacité de chaque valeur avant de la définir comme valeur agrégable, c'est-à-dire multiplier chaque valeur par un certain facteur, le facteur de mise à l'échelle, tout en respectant le budget de contribution.

Bruit relatif avec et sans mise à l'échelle.

Calculer un facteur de scaling

Le facteur de mise à l'échelle représente l'ampleur de la mise à l'échelle d'une valeur agrégable donnée. Sa valeur doit correspondre au budget de contribution divisé par la valeur agrégable maximale pour une clé donnée.

Déterminer le facteur de mise à l'échelle en fonction du budget de contribution.

Supposons, par exemple, que les annonceurs souhaitent connaître la valeur totale des achats. Vous savez que la valeur d'achat maximale attendue d'un achat individuel est de 2 000 €, à l'exception de quelques valeurs aberrantes que vous décidez d'ignorer:

  • Calculez le facteur de scaling: <ph type="x-smartling-placeholder">
      </ph>
    • Pour maximiser le rapport signal sur bruit, vous devez faire passer cette valeur à 65 536 (budget de contribution).
    • Cela se traduit par un facteur de scaling de 65 536 / 2 000 d'environ 32x. En pratique, vous pouvez arrondir ce facteur à la hausse ou à la baisse.
  • Augmentez la valeur de vos valeurs avant l'agrégation. Pour chaque $1 d'achat, incrémentez la métrique suivie de 32. Par exemple, pour un achat de 120 €, définissez une valeur agrégable de 120 x 32 = 3 840.
  • Réduire la valeur de vos valeurs après l'agrégation. Une fois que vous avez reçu le rapport récapitulatif contenant la somme des valeurs des achats pour plusieurs utilisateurs, réduisez la valeur récapitulative à l'aide du facteur de mise à l'échelle que vous utilisiez avant l'agrégation. Dans notre exemple, nous avons utilisé un facteur de mise à l'échelle de 32 avant agrégation. Nous devons donc diviser la valeur récapitulative reçue dans le rapport récapitulatif par 32. Par conséquent, si la valeur d'achat récapitulative pour une clé donnée dans le rapport récapitulatif est de 76 800, la valeur d'achat récapitulative (avec bruit) est de 76 800/32, soit 2 400 $.

Diviser votre budget

Si vous avez plusieurs objectifs de mesure (nombre d'achats et valeur des achats, par exemple), vous pouvez répartir votre budget entre ces objectifs.

Dans ce cas, vos facteurs de scaling seront différents pour différentes valeurs agrégables, en fonction du maximum attendu d'une valeur agrégable donnée.

Pour en savoir plus, consultez Comprendre les clés d'agrégation.

Par exemple, supposons que vous effectuez le suivi du nombre et de la valeur des achats, et que vous décidiez de répartir votre budget de manière égale.

65 536 / 2 = 32 768 peuvent être alloués par type de mesure et par source.

  • Nombre d'achats: <ph type="x-smartling-placeholder">
      </ph>
    • Vous ne suivez qu'un seul achat. Vous ne pouvez donc pas effectuer plus d'un achat pour une conversion donnée.
    • Vous décidez donc de définir le facteur de scaling du nombre d'achats sur 32 768 / 1 = 32 768.
  • Valeur des achats: <ph type="x-smartling-placeholder">
      </ph>
    • Supposons que la valeur d'achat maximale attendue d'un achat individuel soit de 2 000 €.
    • Vous décidez donc de définir votre facteur de scaling pour la valeur des achats à 32 768 / 2 000 = 16,384, soit environ 16.

Des clés d'agrégation plus grossières améliorent le rapport signal/bruit

Étant donné que les clés approximatives détectent plus d'événements de conversion que les clés précises, elles génèrent généralement des valeurs récapitulatives plus élevées.

Les valeurs récapitulatives plus élevées sont moins affectées par le bruit que les valeurs inférieures. le bruit sur ces valeurs est susceptible d'être plus faible, par rapport à cette valeur.

Les valeurs collectées avec des clés plus grosses sont probablement moins bruyantes que les valeurs collectées avec des clés plus précises.

Exemple

Toutes choses égales par ailleurs, une clé qui suit la valeur des achats à l'échelle mondiale (additionnée dans tous les pays) générera une valeur d'achat récapitulative plus élevée (et un nombre de conversions récapitulatif plus élevé) qu'une clé qui suit les conversions au niveau d'un pays.

Par conséquent, le bruit relatif sur la valeur totale des achats pour un pays spécifique sera plus élevé que sur la valeur totale des achats pour tous les pays.

De même, si tous les autres sont identiques, la valeur totale des achats de chaussures est inférieure à la valeur totale des achats de tous les articles (y compris les chaussures).

Par conséquent, le bruit relatif sur la valeur totale des achats de chaussures sera plus élevé que sur la valeur totale des achats pour tous les articles.

Impact sur le bruit avec des clés précises ou approximatives

La somme des valeurs récapitulatives (cumuls) additionne aussi leurs bruits

En additionnant les valeurs récapitulatives des rapports de synthèse pour accéder à des données de niveau supérieur, vous additionnez également le bruit de ces valeurs récapitulatives.

Niveau de bruit avec les clés précises avec cumuls par rapport aux clés approximatives sans cumuls

Examinons deux approches différentes: - Méthode A: vous incluez un ID de zone géographique dans vos clés. Les rapports de synthèse exposent des clés au niveau de l'ID géographique, chacune associée à la valeur d'achat récapitulative au niveau d'un ID géographique spécifique. - Méthode B: n'incluez pas d'ID géographique dans vos clés. Les rapports de synthèse indiquent directement la valeur d'achat récapitulative pour tous les ID / zones géographiques.

Pour connaître la valeur des achats au niveau d'un pays: - Avec l'approche A, vous additionnez les valeurs récapitulatives au niveau de l'ID géographique et, par conséquent, leur bruit. Cela entraînera probablement davantage de bruit ajouté à la valeur d'achat finale au niveau de l'ID géographique. - L'approche B consiste à examiner directement les données présentées dans les rapports récapitulatifs. Le bruit n'a été ajouté qu'une seule fois à ces données.

Par conséquent, la valeur d'achat récapitulative pour un ID géographique donné est susceptible de générer plus de bruit avec l'approche A.

De même, l'ajout d'une dimension au niveau du code postal dans vos clés générera probablement des résultats plus bruyants que l'utilisation de clés plus grosses avec une dimension au niveau de la région.

L'agrégation sur de plus longues périodes augmente le rapport signal/bruit.

Le fait de demander des rapports de synthèse moins souvent signifie que chaque valeur récapitulative sera probablement plus élevée que si vous avez demandé des rapports plus souvent. davantage de conversions sont susceptibles de se produire sur des périodes plus longues.

Comme indiqué précédemment, plus la valeur récapitulative est élevée, plus le bruit relatif est susceptible d'être faible. Par conséquent, demander des rapports récapitulatifs moins fréquemment génère un rapport signal/bruit plus élevé (meilleur).

Demander des rapports récapitulatifs moins fréquemment entraîne un rapport signal/bruit plus élevé

Voici un exemple:

  • Si vous demandez des rapports récapitulatifs horaires sur une période de 24 heures, puis que vous additionnez la valeur récapitulative de chaque rapport horaire pour accéder aux données au niveau de la journée, le bruit est ajouté 24 fois.
  • Dans un rapport récapitulatif quotidien, le bruit n'est ajouté qu'une seule fois.

Valeur epsilon plus élevée, bruit plus faible

Plus la valeur epsilon est élevée, plus le bruit et la protection de la confidentialité sont faibles.

Exploiter le filtrage et la déduplication

Pour répartir le budget entre différentes clés, il est important de comprendre combien de fois un événement donné peut se produire. Par exemple, un annonceur peut s'intéresser à un seul achat par clic, mais peut être intéressé par jusqu'à trois "pages vues du produit". des conversions. Pour prendre en charge ces cas d'utilisation, vous pouvez également exploiter les fonctionnalités d'API suivantes, qui vous permettent de contrôler le nombre de rapports générés et les conversions comptabilisées:

Effectuer des tests avec la valeur epsilon

Les technologies publicitaires peuvent définir la valeur epsilon sur une valeur supérieure à 0 et jusqu'à 64 (inclus). Cette plage permet de réaliser des tests flexibles. Les valeurs inférieures de la valeur epsilon offrent une meilleure protection de la confidentialité. Nous vous recommandons de commencer par epsilon=10.

Recommandations à tester

Nous vous recommandons de suivre les conseils suivants: : commencez par epsilon = 10. - Si cela provoque des problèmes d'énergie importants, augmentez progressivement la valeur epsilon. - Faites part de vos commentaires sur les points d’inflexion spécifiques que vous pourriez trouver en ce qui concerne la facilité d’utilisation des données.

Interagir et partager des commentaires

Vous pouvez participer et tester cette API.

Étapes suivantes