Rauschen in Zusammenfassungsberichten

Hier erfahren Sie, was Rauschen bedeutet, wo sie hinzugefügt werden und wie sie sich auf Ihre Analyse auswirken.

Zusammenfassungsberichte sind das Ergebnis der Aggregation von aggregierbaren Berichten. Wenn aggregierte Berichte von einem Collector in Batches zusammengefasst und vom Aggregationsdienst verarbeitet werden, wird Rauschen – eine zufällige Datenmenge – zu den daraus resultierenden Zusammenfassungsberichten hinzugefügt. Rauschen wird hinzugefügt, um die Privatsphäre der Nutzer zu schützen. Ziel dieses Verfahrens ist es, ein Framework zu schaffen, das differenzielle private Messungen unterstützt.

Dem endgültigen zusammenfassenden Bericht werden Rauschen hinzugefügt.

Einführung in das Rauschen in zusammenfassenden Berichten

Das Hinzufügen von Rauschen ist heutzutage normalerweise nicht Teil der Anzeigenmessung, hat aber in vielen Fällen keinen wesentlichen Einfluss auf Ihre Interpretation Ihrer Ergebnisse.

Es kann hilfreich sein, Folgendes zu bedenken: Würden Sie sich sicher sein, eine Entscheidung auf der Grundlage bestimmter Daten zu treffen, wenn diese Daten nicht unübersichtlich wären?

Würde sich ein Werbetreibender beispielsweise sicher sein, seine Kampagnenstrategie oder Budgets zu ändern, da Kampagne A 15 Conversions und Kampagne B 16 Conversions hatte?

Wenn die Antwort „Nein“ lautet, sind Rauschen irrelevant.

Konfigurieren Sie Ihre API-Nutzung so:

  1. Die Antwort auf die obige Frage lautet „Ja“.
  2. Rauschen wird so verwaltet, dass Ihre Fähigkeit, anhand bestimmter Daten eine Entscheidung zu treffen, nicht wesentlich beeinträchtigt wird. Sie können dies folgendermaßen angehen: Sie möchten, dass das Rauschen im erfassten Messwert für eine erwartete Mindestanzahl von Conversions unter einem bestimmten Prozentsatz bleibt.

In diesem und den folgenden Abschnitten werden Strategien beschrieben, mit denen sich 2.

Wichtige Konzepte

Der Aggregationsdienst fügt jedem Zusammenfassungswert einmal ein Rauschen hinzu, d. h. einmal pro Schlüssel, und zwar jedes Mal, wenn ein Zusammenfassungsbericht angefordert wird.

Diese Rauschwerte werden zufällig aus einer spezifischen Wahrscheinlichkeitsverteilung abgerufen, wie unten erläutert.

Alle Elemente, die das Rauschen beeinflussen, basieren auf zwei Hauptkonzepten.

  1. Die Rauschverteilung (Details unten) ist unabhängig vom Zusammenfassungswert gleich, egal ob niedrig oder hoch. Daher gilt: Je höher der Zusammenfassungswert, desto geringer ist die Auswirkung des Rauschens höchstwahrscheinlich auf diesen Wert.

    Angenommen, sowohl bei einem aggregierten Gesamtkaufwert von 20.000 $als auch bei einem aggregierten Gesamtkaufwert von 200 $werden Rauschen aus derselben Verteilung ausgewählt.

    Nehmen wir an, das Rauschen aus dieser Verteilung schwankt etwa zwischen -100 und +100.

    • Für den zusammengefassten Kaufwert von 20.000 € variiert das Rauschen zwischen 0 und 100 ÷ 20.000=0,5%.
    • Für den zusammengefassten Kaufwert von 200 € variiert das Rauschen zwischen 0 und 100/200=50%.

    Daher hat das Rauschen wahrscheinlich einen geringeren Einfluss auf den aggregierten Kaufwert von 20.000 $als auf den Wert von 200 $. Relativ gesprochen sind 20.000 $ wahrscheinlich weniger Rauschen, d. h., es ist wahrscheinlich, dass es ein höheres Signal-Rausch-Verhältnis hat.

    Höhere aggregierte Werte haben eine relativ geringe Auswirkung auf das Rauschen.

    Dies hat einige wichtige praktische Auswirkungen, die im nächsten Abschnitt erläutert werden. Dieser Mechanismus ist Teil des API-Designs und die praktischen Auswirkungen sind langfristig. Sie werden auch weiterhin eine wichtige Rolle bei der Entwicklung und Bewertung verschiedener Aggregationsstrategien von Anzeigentechnologie-Anbietern spielen.

  2. Obwohl das Rauschen unabhängig vom Zusammenfassungswert aus der gleichen Verteilung stammt, hängt diese Verteilung von mehreren Parametern ab. Einer dieser Parameter, Epsilon, könnte während des abgeschlossenen Ursprungstests von Anzeigentechnologien geändert werden, um verschiedene Anpassungen im Hinblick auf den Nutzen und den Datenschutz zu bewerten. Betrachten Sie jedoch die Möglichkeit zur Feinabstimmung von Epsilon als temporär. Wir freuen uns über Feedback zu Ihren Anwendungsfällen und den Werten von Epsilon, die gut funktionieren.

Ein AdTech-Unternehmen hat zwar keine direkte Kontrolle darüber, wie Rauschen hinzugefügt wird, kann jedoch die Auswirkungen von Lärm auf seine Messdaten beeinflussen. In den nächsten Abschnitten sehen wir uns an, wie Geräusche in der Praxis beeinflusst werden können.

Sehen wir uns zuerst einmal genauer an, wie Rauschen angewendet wird.

Heranzoomen: wie Rauschen angewendet wird

Eine Rauschverteilung

Das Rauschen wird mit den folgenden Parametern aus der Laplace-Verteilung bezogen:

  • Der Mittelwert (μ) ist 0. Das bedeutet, dass der wahrscheinlichste Rauschwert 0 ist (kein Rauschen hinzugefügt) und dass der Rauschwert genauso wahrscheinlich kleiner als das Original ist und größer ist. Dies wird manchmal als unverzerrt bezeichnet.
  • Ein Skalierungsparameter von b = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET wird im Browser definiert.
    • epsilon wurde im Aggregationsserver festgelegt.

Das folgende Diagramm zeigt die Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20:

Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20

Zufällige Rauschwerte, eine Rauschverteilung

Angenommen, ein Anzeigentechnologie-Anbieter fordert zusammenfassende Berichte für die beiden Aggregationsschlüssel „Schlüssel1“ und „Schlüssel2“ an.

Der Aggregationsdienst wählt zwei Rauschwerte x1 und x2 gemäß derselben Rauschverteilung aus. x1 wird zum Zusammenfassungswert für Schlüssel1 und x2 zum Zusammenfassungswert für Schlüssel2 addiert.

In den Diagrammen werden Rauschwerte als identisch dargestellt. Dies ist eine Vereinfachung. in Wirklichkeit variieren die Rauschwerte, da sie zufällig aus der Verteilung abgerufen werden.

Dies zeigt, dass die Rauschwerte alle aus derselben Verteilung stammen und unabhängig von dem Zusammenfassungswert sind, auf den sie angewendet werden.

Andere Eigenschaften von Rauschen

Rauschen wird auf jeden Zusammenfassungswert angewendet, auch auf leere Werte (0).

Auch leere Zusammenfassungswerte sind verrauscht.

Selbst wenn beispielsweise der tatsächliche Zusammenfassungswert für einen bestimmten Schlüssel 0 ist, ist der verrauschte Zusammenfassungswert, den Sie im Zusammenfassungsbericht für diesen Schlüssel sehen, höchstwahrscheinlich nicht 0.

Rauschen kann entweder eine positive oder negative Zahl sein.

Beispiele für positives und negatives Rauschen

Bei einem Kaufbetrag von 327.000 vor Rauschen kann das Rauschen beispielsweise +6.000 oder -6.000 sein (dies sind beliebige Beispielwerte).

Rauschen auswerten

Die Standardabweichung des Rauschens berechnen

Die Standardabweichung des Rauschens lautet:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Beispiel

Mit Epsilon = 10 lautet die Standardabweichung des Rauschens:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Beurteilen, wann die Messunterschiede signifikant sind

Da Sie die Standardabweichung des Rauschens kennen, das jedem von dem Aggregationsdienst ausgegebenen Wert hinzugefügt wird, können Sie geeignete Schwellenwerte für den Vergleich festlegen, um festzustellen, ob beobachtete Unterschiede auf Rauschen zurückzuführen sind.

Wenn das Rauschen, das einem Wert hinzugefügt wird, etwa +/- 10 beträgt (unter Berücksichtigung der Skalierung) und der Wert der Differenz zwischen zwei Kampagnen mehr als 100 beträgt, ist davon auszugehen, dass der Unterschied des gemessenen Werts zwischen den einzelnen Kampagnen nicht allein auf Rauschen zurückzuführen ist.

Engage and share feedback

You can participate and experiment with this API.

Nächste Schritte