Informationen zu diesem Dokument
Wenn Sie dieses Dokument lesen, werden Sie:
- Bevor Sie Zusammenfassungsberichte erstellen, sollten Sie sich damit vertraut machen, welche Strategien Sie erstellen sollten.
- Wir stellen vor: Noise Lab, ein Tool, das die Auswirkungen verschiedener Rauschparameter erfasst und mit dem sich verschiedene Strategien zum Geräuschmanagement schnell untersuchen und bewerten lassen.
Feedback geben
In diesem Dokument werden einige Prinzipien für zusammenfassende Berichte zusammengefasst. Es gibt verschiedene Ansätze für das Geräuschmanagement, die möglicherweise nicht hier. Wir freuen uns über Vorschläge, Ergänzungen und Fragen.
- Wenn Sie an der Öffentlichkeit Feedback zu Strategien für Lärmmanagement geben möchten, Nutzen oder Datenschutz der API (Epsilon) verständlich machen und Ihre Beobachtungen mitteilen, Simulation mit Noise Lab: Kommentar zu diesem Problem
- Um öffentliches Feedback zu Noise Lab zu geben (Frage stellen, Fehler melden, Funktion anfordern): Hier kannst du eine neue Ausgabe erstellen
- So geben Sie öffentliches Feedback zu einem anderen Aspekt der API: Hier kannst du eine neue Ausgabe erstellen
Vorbereitung
- Eine Einführung finden Sie in den Artikeln Attributionsberichte: zusammenfassende Berichte und Vollständige Systemübersicht zu Attribution Reporting.
- Scannen Sie Rauschen verstehen und Aggregationsschlüssel verstehen, um diese Anleitung optimal zu nutzen.
Designentscheidungen
Zentrales Designprinzip
Es gibt grundlegende Unterschiede zwischen der Funktionsweise von Drittanbieter-Cookies und Zusammenfassungsberichten. Ein wesentlicher Unterschied ist die Rauschen, die Messdaten in zusammenfassenden Berichten hinzugefügt wurden. Eine andere Möglichkeit ist die Planung von Berichten.
Um auf Messdaten des zusammenfassenden Berichts mit einem höheren Signal-zu-Rausch-Verhältnis zuzugreifen Demand-Side-Plattformen (DSPs) und Anbieter von Anzeigenmessungen müssen Gemeinsam mit ihren Werbetreibenden Strategien zum Geräuschmanagement entwickeln. Für die Entwicklung dieser Strategien müssen DSPs und Analyseanbieter Designentscheidungen treffen. Diese Entscheidungen drehen sich um ein wesentliches Konzept:
Die Rauschwerte für die Verteilung beziehen sich zwar ausschließlich auf zwei Parameter: Epsilon und das Beitragsbudget. Signal-Rausch-Verhältnisse Ihrer ausgegebenen Messdaten.
Wir gehen zwar davon aus, dass ein iterativer Prozess zu den besten Entscheidungen führt, doch jede Variante dieser Entscheidungen führen zu einer etwas anderen Implementierung. Daher müssen diese Entscheidungen vor dem Schreiben jeder Codeiteration und vor dem Schalten von Anzeigen getroffen werden.
Entscheidung: Detaillierungsgrad der Dimension
Im Noise Lab ausprobieren
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig sind die TOTAL täglich die Anzahl der zugeordneten Conversions bei 1.000 liegt. Dies entspricht durchschnittlich etwa 40 pro Bucket, wenn Sie die Standardkonfiguration verwenden (Standarddimensionen, Standardanzahl von mögliche unterschiedliche Werte für jede Dimension, Schlüsselstrategie A). Beobachten Sie, der Wert „40“ in der Eingabe im Feld „Durchschnittliche täglich zuordenbare Conversion-Anzahl“ PRO BUCKET.
- Klicken Sie auf Simulieren, um eine Simulation mit den Standardparametern auszuführen.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Dimensionen“. Umbenennen Geografie in Stadt und ändern Sie die Anzahl der möglichen unterschiedlichen Werte in 50.
- Beobachten Sie, wie sich dadurch die durchschnittliche täglich zuordenbare Conversion ändert. Anzahl PRO BUCKET. Jetzt ist er viel niedriger. Das liegt daran, dass Sie die Anzahl möglicher Werte innerhalb dieser Dimension, ohne sich zu ändern erhöhen Sie die Gesamtzahl der Buckets, wie viele Conversion-Ereignisse in jede Gruppe fallen.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation: Rauschverhältnisse sind jetzt höher als in der vorherigen Simulation.
Angesichts des Designprinzips sind niedrige zusammengefasste Werte wahrscheinlich rauschen ist als große Zusammenfassungswerte. Daher ist Ihre Konfigurationsauswahl beeinflusst, wie viele zugeordnete Conversion-Ereignisse in der jeweiligen Gruppe landen (andernfalls als Aggregationsschlüssel bezeichnet), und diese Menge wirkt sich auf das Rauschen im zusammenfassende Berichte.
Eine Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse auswirkt innerhalb eines einzelnen Buckets ist der Detaillierungsgrad der Dimension. Betrachten Sie die folgenden Beispiele von Aggregationsschlüsseln und ihren Dimensionen:
- Ansatz 1: Eine Schlüsselstruktur mit groben Dimensionen: Land x Werbekampagne (oder die größte Kampagne) Aggregations-Bucket) x Produkttyp (von zehn möglichen Produkttypen)
- Methode 2: Eine Schlüsselstruktur mit detaillierten Dimensionen: Stadt x Creative-ID x Produkt (von 100 möglichen Produkten)
Stadt ist eine detailliertere Dimension als Land. Die Creative-ID ist detaillierter. als Campaign. und Product ist detaillierter als Product type. Dementsprechend wird Methode 2 hat eine geringere Anzahl von Ereignissen (Conversions) pro Bucket (= pro in der Zusammenfassungsberichtausgabe) als bei Ansatz 1. Da der Geräuschpegel ist die Ausgabe unabhängig von der Anzahl der Ereignisse im Bucket, den Messdaten Zusammenfassungsberichte werden bei Ansatz 2 ungenauer. Experimentieren Sie für jeden Werbetreibenden mit verschiedenen Kompromisse bei der Granularität im Design des Schlüssels ein, um den größtmöglichen Nutzen die Ergebnisse.
Entscheidung: Schlüsselstrukturen
Im Noise Lab ausprobieren
Im einfachen Modus wird die Standardschlüsselstruktur verwendet. Klicken Sie im Menü können Sie mit verschiedenen Schlüsselstrukturen experimentieren. Einige Beispieldimensionen enthalten sind; können Sie diese auch ändern.
- Wechsle zum erweiterten Modus.
- Suche in der Seitenleiste „Parameter“ nach „Schlüsselstrategie“. Beobachten dass die Standardstrategie, im Tool A genannt, einen detaillierten Schlüssel verwendet, Struktur, die alle Dimensionen enthält: Geografie x Kampagnen-ID x Produkt Kategorie.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Ändern Sie die Schlüsselstrategie in B. Dadurch werden zusätzliche Steuerelemente angezeigt. zum Konfigurieren der Schlüsselstruktur.
- Konfigurieren Sie die Schlüsselstruktur, z.B. wie folgt:
<ph type="x-smartling-placeholder">
- </ph>
- Anzahl der Schlüsselstrukturen: 2
- Schlüsselstruktur 1 = Geografie x Produktkategorie.
- Schlüsselstruktur 2 = Kampagnen-ID × Produktkategorie
- Klicken Sie auf „Simulieren“.
- Sie erhalten jetzt zwei zusammenfassende Berichte pro Typ von Analyseziel. (zwei für die Anzahl der Käufe, zwei für den Kaufwert), zwei unterschiedliche Schlüsselstrukturen. Beobachten Sie ihre Rauschverhältnisse.
- Sie können dies auch mit eigenen benutzerdefinierten Dimensionen ausprobieren. Klicken Sie dazu auf für die zu erfassenden Daten: Dimensionen. Sie sollten das Beispiel entfernen Dimensionen erstellen und mithilfe der Optionen zum Hinzufügen/Entfernen/Zurücksetzen unter der letzten Dimension.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversions auswirkt innerhalb eines Buckets Schlüsselstrukturen die Sie nutzen möchten. Sehen Sie sich die folgenden Beispiele für Aggregationsschlüssel an:
- Eine Schlüsselstruktur mit allen Dimensionen: Diese Strategie nennen wir „A“.
- Zwei Hauptstrukturen mit jeweils einer Teilmenge von Dimensionen: nennen wir das Strategie B.
Strategie A ist einfacher. Möglicherweise müssen Sie jedoch die verrauschten Zusammenfassungswerte aus Zusammenfassungsberichten zusammenfassen, um auf bestimmte Erkenntnisse zuzugreifen. Indem Sie diese Werte summieren, summieren Sie auch das Rauschen. Bei Strategie B werden zusammenfassende Werte erhalten Sie möglicherweise bereits die Informationen, die Sie benötigen. Das bedeutet, dass Strategie B ist wahrscheinlich zu besseren Signal-Rausch-Verhältnissen führen als bei Strategie A. Die Rauschen kann bei Strategie A bereits akzeptabel sein. der Einfachheit halber Strategie A. Weitere Informationen finden Sie im detaillierten Beispiel, in dem diese beiden Strategien dargestellt werden.
Die Schlüsselverwaltung ist ein tiefgründiges Thema. Eine Reihe ausgefeilter Techniken können um die Signal-Rausch-Verhältnisse zu verbessern. Eine wird unter Erweiterter Schlüssel beschrieben Verwaltung von Google-Produkten.
Entscheidung: Batching-Häufigkeit
Im Noise Lab ausprobieren
- Wechseln Sie in den einfachen Modus (oder den erweiterten Modus – beide Modi funktionieren bei der Batch-Häufigkeit anwenden)
- Suchen Sie in der Seitenleiste „Parameter“ nach „Aggregationsstrategie“ > Batching-Häufigkeit. Dies bezieht sich auf die Batch-Häufigkeit die mit dem Aggregationsdienst verarbeitet werden, für einen Job.
- Beachten Sie die standardmäßige Batchhäufigkeit: standardmäßig eine tägliche Batchverarbeitung Frequenz simuliert.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Ändern Sie die Batchhäufigkeit in wöchentlich.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation: Rauschverhältnisse sind jetzt niedriger (besser) als in der vorherigen Simulation.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversions auswirkt für Ereignisse innerhalb eines einzelnen Buckets ist die Batchhäufigkeit, die Sie verwenden möchten. Die Die Batch-Häufigkeit gibt an, wie oft aggregierte Berichte verarbeitet werden.
Ein Bericht, für den eine häufigere (z.B. stündlich) Aggregation geplant ist, weniger Conversion-Ereignisse enthalten als in einem Bericht mit einer Aggregationszeitplan (z.B. jede Woche). Daher enthält der stündliche Bericht mehr Rauschen.``` weniger Conversion-Ereignisse enthalten als in einem Bericht mit einer Aggregationszeitplan (z.B. jede Woche). Daher enthält der stündliche Bericht ein niedrigeres Signal-Rausch-Verhältnis als der wöchentliche Bericht. Experimentieren Sie mit Berichtsanforderungen bei verschiedenen Frequenzen und bewerten Sie jeweils das Signal-Rausch-Verhältnis.
Weitere Informationen finden Sie unter Stapelverarbeitung und Aggregierung über längere Zeiträume.
Entscheidung: Kampagnenvariablen, die sich auf zuordenbare Conversions auswirken
Im Noise Lab ausprobieren
Dies ist zwar schwer vorherzusagen und kann erhebliche Schwankungen auch die Anzahl der täglichen Single-Touch-Conversions zuordnen können. 1.000 oder 10.000.
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig sind die TOTAL täglich die Anzahl der zugeordneten Conversions bei 1.000 liegt. Dies entspricht durchschnittlich etwa 40 pro Bucket, wenn Sie die Standardkonfiguration verwenden (Standarddimensionen, Standardanzahl von mögliche unterschiedliche Werte für jede Dimension, Schlüsselstrategie A). Beobachten Sie, der Wert „40“ in der Eingabe im Feld „Durchschnittliche täglich zuordenbare Conversion-Anzahl“ PRO BUCKET.
- Klicken Sie auf Simulieren, um eine Simulation mit den Standardparametern auszuführen.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Legen Sie nun die täglich zugeordnete Conversion-Anzahl TOTAL auf 100 fest. Dadurch verringert sich der Wert für Conversion-Anzahl PRO BUCKET.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse jetzt höher sind. Das liegt daran, dass Sie haben weniger Conversions pro Bucket, werden mehr Rauschen angewendet, um Datenschutz.
Ein wichtiger Unterschied ist die Gesamtzahl der möglichen Conversions für eine des Werbetreibenden im Vergleich zur Gesamtzahl der möglichen zugeordneten Conversions. Die Letzteres ist das, was sich letztlich auf das Rauschen in zusammenfassenden Berichten auswirkt. Zugeordnet Conversions stellen eine Teilmenge der gesamten Conversions dar, die anfällig für Kampagnen sind. Variablen wie Anzeigenbudget und Anzeigenausrichtung. Zum Beispiel würde ein höhere Anzahl zugeordneter Conversions bei einer Werbekampagne im Wert von 10 Mio. € gegenüber einer Anzeige im Wert von 10.000 € bei allen anderen gleich.
Beachten Sie Folgendes:
- Zugeordnete Conversions auf Single-Touch-Geräten auf demselben Gerät bewerten Attributionsmodell, da diese in zusammenfassenden Berichten enthalten sind die mit der Attribution Reporting API erfasst wurden.
- Anzahl der Worst-Case- und Best-Case-Szenarien berücksichtigen für zugeordnete Conversions. Wenn z. B. alle anderen Faktoren gleich sind, betrachten Sie die minimalen und maximalen Kampagnenbudgets für einen Werbetreibenden, dann zuordenbare Conversions für beide Ergebnisse als Eingaben für Ihre Simulationsspiele.
- Wenn Sie in Betracht ziehen, Privacy Sandbox für Android plattformübergreifende zugeordnete Conversions in die Berechnung einfließen.
Entscheidung: Skalierung verwenden
Im Noise Lab ausprobieren
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Aggregationsstrategie“ > Skalierung. Die Standardeinstellung ist „Ja“.
- Um die positiven Auswirkungen der Skalierung auf das Rauschen zu verstehen stellen Sie zunächst "Skalierung" auf "Nein".
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Setzen Sie „Skalierung“ auf „Ja“. Noise Lab berechnet automatisch die Skalierungsfaktoren, die in Anbetracht der Bereiche (Durchschnitts- und Maximalwerte) von die Messziele für Ihr Szenario. In einem echten System oder Ursprungstest sollten Sie Ihre eigene Berechnung für Skalierungsfaktoren implementieren.
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse sind jetzt in dieser Sekunde niedriger (besser) Simulationsspiele. Das liegt daran, dass Sie Skalierung verwenden.
Angesichts des Designgrundsatzes wird das hinzugefügte Rauschen eine Funktion des Beitragsbudgets.
Um die Signal-Rausch-Verhältnisse zu erhöhen, können Sie sich daher für Werte, die während eines Conversion-Ereignisses erfasst werden, indem Sie sie mit den Werten des Beitragsbudgets (und dessen Skalierung nach der Aggregation). Verwenden Sie Skalierung, um Signal-Rausch-Verhältnisse zu erhöhen.
Entscheidung: Anzahl der Analyseziele und Aufteilung des Datenschutzbudgets
Dies bezieht sich auf die Skalierung, lesen Sie den Abschnitt Verwenden Skalierung.
Im Noise Lab ausprobieren
Ein Messziel ist ein einzelner Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach Daten, die Sie erfassen möchten: Messziele Standardmäßig gibt es zwei Messziele: Kauf und die Anzahl der Käufe.
- Klicken Sie auf Simulieren , um eine Simulation mit den Standardzielen durchzuführen.
- Klicken Sie auf Entfernen. Dadurch wird das letzte Analyseziel entfernt (Kauf Zählung in diesem Fall).
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse für den Kaufwert sind jetzt niedriger (besser) für diese zweite Simulation. Das liegt daran, dass Sie weniger Ihre Analyseziele, sodass Ihr einziges Analyseziel alle Beitragsbudget.
- Klicken Sie auf „Zurücksetzen“. Jetzt haben Sie wieder zwei Analyseziele: Kauf und die Anzahl der Käufe. Noise Lab berechnet den zu verwendende Skalierungsfaktoren bezogen auf die Bereiche (Durchschnitts- und Maximalwerte) der Analyseziele für Ihr Szenario. Standardmäßig teilt Noise Lab die gleichmäßig auf alle Analyseziele verteilt.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation. Beachten Sie die Skalierungsfaktoren, die in der Simulation angezeigt werden.
- Passen wir nun die Aufteilung des Datenschutzbudgets an, Signal-Rausch-Verhältnisse.
- Den für jedes Messziel zugewiesenes Budget in Prozent optimieren Bei der Standardeinstellung ist das Messungsziel 1, also der Kaufwert, größerer Bereich (zwischen 0 und 1.000) als bei Analyseziel 2, nämlich Anzahl der Käufe (zwischen 1 und 1, d.h. ist immer gleich 1). Aus benötigt es "mehr Platz zum Skalieren": Idealerweise sollten Beitragsbudget zu Messziel 1 als Analyseziel 2, sodass effizienter hochskaliert werden (siehe Skalierung) und daher
- Weisen Sie Messziel 1 70% des Budgets zu. Messung 30% zuweisen Ziel 2.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation. Zum Kauf sind die Rauschverhältnisse jetzt deutlich niedriger (besser) als beim vorherigen Simulationsspiele. Für die Anzahl der Käufe sind sie weitgehend unverändert.
- Optimieren Sie die Budgetaufteilung für alle Messwerte weiter. Beobachten Sie, wie sich das Lärm.
Sie können Ihre eigenen benutzerdefinierten Analyseziele festlegen. Verwenden Sie dazu das Schaltflächen zum Hinzufügen/Entfernen/Zurücksetzen.
Wenn Sie einen Datenpunkt (Messziel) für ein Conversion-Ereignis wie Conversion-Anzahl kann dieser Datenpunkt das gesamte Beitragsbudget (65.536) erhalten. Wenn Sie für ein Conversion-Ereignis mehrere Messziele festlegen, wie Conversion-Anzahl und Kaufwert, müssen diese Datenpunkte wird das Beitragsbudget gemeinsam genutzt. So haben Sie weniger Spielraum, Werte.
Je mehr Messziele Sie haben, desto geringer sind die Signal-Rausch-Verhältnisse. wahrscheinlich (höheres Rauschen).
Eine weitere Entscheidung in Bezug auf Analyseziele ist die Budgetaufteilung. Wenn Sie das Beitragsbudget gleichmäßig auf zwei Datenpunkte aufteilen, erhält jeder Datenpunkt ein Budget von 65.536/2 = 32.768. Dies kann je nach für jeden Datenpunkt den maximal möglichen Wert. Wenn Sie beispielsweise die Anzahl der Käufe mit einem maximalen Wert von 1 und den Kaufwert mit einem mindestens 1 und höchstens 120, wäre der Kaufwert von Vorteil, wenn „mehr Platz“ d. h., um einen größeren Anteil des Beitragsbudget. Sie sehen, ob einige Analyseziele priorisiert werden sollten in Bezug auf die Auswirkungen von Lärm.
Entscheidung: Ausreißermanagement
Im Noise Lab ausprobieren
Ein Messziel ist ein einzelner Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Aggregationsstrategie“ > Skalierung.
- Achten Sie darauf, dass Skalierung auf Ja eingestellt ist. Hinweis: Noise Lab automatisch die zu verwendenden Skalierungsfaktoren auf Basis des Bereiche (Durchschnitts- und Höchstwerte) zu definieren, die Sie für die Messziele angegeben haben.
- Nehmen wir an, dass der größte Kauf, der je getätigt wurde, 2.000 $betrug, zwischen 10 und 120 € liegen. Sehen wir uns zunächst an, bei Verwendung einer literalen Skalierung (nicht empfohlen): Geben Sie $2000 als Maximalwert für „purchaseValue“.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse hoch sind. Das liegt daran, dass unsere Skalierung derzeit auf 2.000 $berechnet, obwohl in Wirklichkeit deutlich niedriger sein werden.
- Lassen Sie uns nun einen pragmatischeren Skalierungsansatz anwenden. Den Maximalwert ändern Kaufwert auf 120 €.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse in dieser zweiten Simulation niedriger (besser) sind.
Zur Implementierung der Skalierung berechnen Sie Den maximal möglichen Wert für ein bestimmtes Conversion-Ereignis Weitere Informationen finden Sie in diesem Beispiel.
Vermeiden Sie es jedoch, einen literalen Maximalwert zur Berechnung dieses Skalierungsfaktors zu verwenden. da dies Ihre Signal-Rausch-Verhältnisse verschlechtern würde. Entfernen Sie stattdessen Ausreißer und einen pragmatischen Maximalwert.
Das Ausreißermanagement ist ein tief verwurzeltes Thema. Eine Reihe ausgefeilter Techniken können um die Signal-Rausch-Verhältnisse zu verbessern. Eine wird beschrieben in Erweiterte Verwaltung von Ausreißern:
Nächste Schritte
Nachdem Sie nun verschiedene Strategien zum Geräuschmanagement für Ihren Anwendungsfall können Sie mit zusammenfassenden Berichten experimentieren, indem Sie Messdaten über einen Ursprungstest übertragen werden. Sehen Sie sich Leitfäden und Tipps zum Testen der API an.
Anhang
Kurze Einführung in Noise Lab
Noise Lab hilft dir dabei, Lärmmanagement-Strategien bewerten und vergleichen. Sie können damit:
- Die wichtigsten Parameter, die das Rauschen beeinflussen können, verstehen und welchen Effekt sie haben.
- Simulieren Sie die Auswirkung von Rauschen auf die ausgegebenen Messdaten anhand der gegebenen unterschiedliche Designentscheidungen treffen. Optimieren Sie die Designparameter, bis Sie eine Signal-Rausch-Verhältnis, das für Ihren Anwendungsfall geeignet ist.
- Teilen Sie uns Ihr Feedback zum Nutzen der zusammenfassenden Berichte mit: funktionieren die Epsilon- und Rauschparameter für Sie. Wo sind die Wendepunkte?
Betrachten Sie dies als Vorbereitungsschritt. Noise Lab Messdaten erstellt, um Zusammenfassungsberichte zu simulieren, die auf Ihrem Eingabe. Sie bleibt nicht erhalten und gibt keine Daten weiter.
Im Noise Lab gibt es zwei verschiedene Modi:
- Einfacher Modus: Die Grundlagen der Steuerelemente verstehen auf Lärm.
- Erweiterter Modus: Verschiedene Strategien für das Geräuschmanagement testen und bewerten die zu den besten Signal-Rausch-Verhältnissen für Ihre Anwendungsfälle führt.
Klicken Sie auf die Schaltflächen im oberen Menü, um zwischen den beiden zu wechseln. (Punkt 1 im Screenshot unten).
Einfacher Modus
- Im einfachen Modus steuern Sie die Parameter (auf der linken Seite oder #2. (siehe Screenshot unten)) wie Epsilon, und sehen Sie sich an, wie sie sich auf das Geräusch auswirken.
- Für jeden Parameter gibt es eine Kurzinfo (Schaltfläche „?“). Klicken Sie hier, um eine Erklärung der einzelnen Parameter (3. im Screenshot unten)
- Klicken Sie zum Starten auf „Simulate“ (Simulieren). und beobachten Sie, wie die Ausgabe aussieht. (4. im Screenshot unten).
- Im Bereich „Output“ (Ausgabe) werden eine Vielzahl von Details angezeigt. Einige steht neben den Elementen ein „?“. Nehmen Sie sich die Zeit, auf die einzelnen "?" zu klicken, um ein Erläuterung der verschiedenen Informationen.
- Klicken Sie im Bereich „Output“ (Ausgabe) auf die Ein/Aus-Schaltfläche „Details“. wenn Sie eine maximierte Version der Tabelle ansehen möchten (5. im Screenshot unten).
- Unter jeder Datentabelle im Ausgabebereich befindet sich eine Option, um die Tabelle für die Offlinenutzung herunterzuladen. Außerdem finden Sie unten können Sie alle Datentabellen herunterladen (#6. Screenshot unten)
- Verschiedene Einstellungen für die Parameter im Bereich „Parameter“ testen und klicken Sie auf „Simulieren“, um zu sehen, wie sie sich auf die Ausgabe auswirken: <ph type="x-smartling-placeholder">
Erweiterter Modus
- Im erweiterten Modus haben Sie mehr Kontrolle über die Parameter. Ich benutzerdefinierte Analyseziele und -dimensionen hinzufügen (#1. und 2. im Screenshot) unten)
- Scrollen Sie im Abschnitt "Parameter" weiter nach unten und sehen Sie sich den
Strategie. Damit lassen sich verschiedene Schlüsselstrukturen
(3. im Screenshot unten)
<ph type="x-smartling-placeholder">
- </ph>
- Wenn Sie verschiedene Schlüsselstrukturen testen möchten, stellen Sie die Strategie auf „B“ um
- Geben Sie die Anzahl der verschiedenen Schlüsselstrukturen ein, die Sie verwenden möchten (Standardeinstellung ist „2“)
- Auf „Schlüsselstrukturen generieren“ klicken
- Optionen zum Festlegen Ihrer Schlüsselstrukturen werden angezeigt, wenn Sie auf Klicken Sie die Kästchen neben den Schlüsseln an, die Sie für die einzelnen Schlüsselstrukturen verwenden möchten.
- Klicken Sie auf Simulate (Simulieren), um die Ausgabe anzuzeigen. <ph type="x-smartling-placeholder"> <ph type="x-smartling-placeholder">
Rauschmesswerte
Kernkonzept
Rauschen wird hinzugefügt, um die Privatsphäre der einzelnen Nutzer zu schützen.
Ein hoher Rauschwert deutet darauf hin, dass Buckets/Schlüssel dünnbesetzt sind Beiträge aus einer begrenzten Anzahl sensibler Ereignisse enthalten. Fertig automatisch von Noise Lab, damit sich die Teilnehmer in der Menge verstecken, oder in um die Rechte dieser eingeschränkten Personen zu schützen. mehr Datenschutz bieten, von zusätzlichem Rauschen.
Ein geringer Rauschwert deutet darauf hin, dass die Datenkonfiguration so konzipiert wurde, eine Möglichkeit, sich „in der Menge“ zu verstecken. Das bedeutet, dass die Gruppen Beiträge von einer ausreichenden Anzahl von Ereignissen enthalten, die Privatsphäre der einzelnen Nutzenden geschützt wird.
Diese Anweisung trifft sowohl auf den durchschnittlichen prozentualen Fehler (APE) zu und RMSRE_T (relativer Root-Mittelwert mit einem Schwellenwert).
APE (durchschnittlicher prozentualer Fehler)
APE ist das Verhältnis des Rauschens zum Signal, also der tatsächliche Zusammenfassungswert.p> Niedrigere APE-Werte bedeuten bessere Signal-Rausch-Verhältnisse.
Formel
Für einen bestimmten zusammenfassenden Bericht wird die APE wie folgt berechnet:
<ph type="x-smartling-placeholder">True ist der tatsächliche Zusammenfassungswert. APE ist der Durchschnitt der Rauschpegel pro wahrer Zusammenfassungswert, gemittelt aus allen Einträgen in einem Zusammenfassungsbericht. In Noise Lab wird dieser Wert dann mit 100 multipliziert, um einen Prozentsatz zu erhalten.
Vor- und Nachteile
Segmente mit kleineren Größen haben unverhältnismäßig große Auswirkungen auf den endgültigen Wert von APE. Das könnte irreführend sein, wenn Sie Lärm bewerten. Aus diesem Grund haben wir einen weiteren Messwert namens RMSRE_T hinzugefügt, der diese Einschränkung von APE minimieren soll. Weitere Informationen finden Sie in den Beispielen.
Code
Überprüfen Sie den Quellcode. für die APE-Berechnung.
RMSRE_T (relativer Root-Mittelwert mit einem Schwellenwert)
RMSRE_T (relativer Stamm der mittleren quadratischen Abweichung mit einem Schwellenwert) ist ein weiteres Maß für das Rauschen.
RMSRE_T interpretieren
Niedrigere RMSRE_T-Werte bedeuten bessere Signal-Rausch-Verhältnisse.
Wenn beispielsweise ein für Ihren Anwendungsfall akzeptables Rauschverhältnis 20 % und RMSRE_T 0, 2 ist, können Sie sicher sein, dass der Rauschpegel in Ihren akzeptablen Bereich fällt.
Formel
Für einen bestimmten zusammenfassenden Bericht wird RMSRE_T wie folgt berechnet:
<ph type="x-smartling-placeholder">Vor- und Nachteile
RMSRE_T ist etwas komplexer zu verstehen als APE. Sie hat jedoch einige Vorteile, die sie in einigen Fällen dazu führen, dass sie besser als APE für die Analyse von Rauschen in zusammenfassenden Berichten geeignet ist:
- RMSRE_T ist stabiler. „D“ ist ein Grenzwert. „D“ wird verwendet, um Buckets bei der Berechnung von RMSRE_T eine geringere Gewichtung zu geben, die weniger Conversions aufweisen und daher aufgrund ihrer Größe empfindlicher auf Rauschen reagieren. Bei T steigt der Messwert bei Buckets mit wenigen Conversions nicht stark an. Wenn T gleich 5 ist, wird ein Rauschwert von nur 1 bei einer Gruppe mit 0 Conversions nicht als weit über 1 angezeigt. Stattdessen wird sie auf 0, 2 begrenzt, was 1/5 entspricht, da T gleich 5 ist. Da kleinere Gruppen, die daher rauschenempfindlicher sind, weniger gewichtet werden, ist dieser Messwert stabiler und erleichtert den Vergleich von zwei Simulationen.
- RMSRE_T ermöglicht eine einfache Aggregation. Wenn Sie den RMSRE_T von mehreren Buckets zusammen mit ihrer tatsächlichen Anzahl kennen, können Sie den RMSRE_T ihrer Summe berechnen. Auf diese Weise können Sie auch für RMSRE_T für diese kombinierten Werte optimieren.
Für APE ist zwar eine Aggregation möglich, die Formel ist jedoch ziemlich kompliziert, da sie den absoluten Wert der Summe von Laplace-Rauschen beinhaltet. Das erschwert die Optimierung von APE.
Code
Überprüfen Sie den Quellcode für die RMSRE_T-Berechnung.
Beispiele
Zusammenfassender Bericht mit drei Gruppen:
- bucket_1 = Rauschen: 10, trueSummaryValue: 100
- bucket_2 = Rauschen: 20, trueSummaryValue: 100
- bucket_3 = Rauschen: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Zusammenfassungsbericht mit drei Gruppen:
- bucket_1 = Rauschen: 10, trueSummaryValue: 100
- bucket_2 = Rauschen: 20, trueSummaryValue: 100
- bucket_3 = Rauschen: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Zusammenfassungsbericht mit drei Gruppen:
- bucket_1 = Rauschen: 10, trueSummaryValue: 100
- bucket_2 = Rauschen: 20, trueSummaryValue: 100
- bucket_3 = Rauschen: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + unendlich) / 3 = unendlich
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Erweiterte Schlüsselverwaltung
Ein DSP oder Unternehmen für die Anzeigenmessung kann weltweit Tausende Kunden aus verschiedenen Branchen, Währungen und Kaufpreis Potenziale. Das Erstellen und Verwalten eines Aggregationsschlüssels pro wahrscheinlich sehr unpraktisch sein. Außerdem wird es ist es schwierig, einen maximalen aggregierbaren Wert und ein Aggregationsbudget auszuwählen, die Auswirkungen von Lärm bei den Tausenden von Werbetreibenden weltweit reduzieren. Stattdessen betrachten wir die folgenden Szenarien:
Schlüsselstrategie A
Der Anbieter von Anzeigentechnologien beschließt, einen Schlüssel für alle für Werbekunden. Bei allen Werbetreibenden und in allen Währungen gibt es Käufe variieren von niedrigem Volumen, High-End-Käufen bis zu hohem Volumen, Low-End- Käufe. Daraus ergibt sich der folgende Schlüssel:
Schlüssel (mehrere Währungen) | |
---|---|
Max. aggregierter Wert | 5.000.000 |
Kaufwertbereich | [120–5000000] |
Hauptstrategie B
Der Anbieter von Anzeigentechnologien beschließt, zwei Schlüssel für alle für Werbekunden. Sie beschließt, die Schlüssel nach Währung zu trennen. Über alle Werbetreibenden und allen Währungen gibt, unterscheidet sich die Bandbreite der Einkäufe von geringem Volumen, von High-End-Käufen bis hin zu hohen Volumen und Low-End-Käufen. Trennen Sie die Daten nach Währung, werden zwei Schlüssel erstellt:
Schlüssel 1 (USD) | Schlüssel 2 (¥) | |
---|---|---|
Max. aggregierter Wert | 40.000 $ | 5.000.000 Yen |
Kaufwertbereich | [120–40.000] | [15.000–5.000.000] |
Das Ergebnis von Hauptstrategie B ist weniger unübersichtlich als bei Strategie A, da Währungswerte sind nicht gleichmäßig auf die Währungen verteilt. Beispiel: Überlegen Sie, wie die in Yen angegebenen Käufe mit den in USD ändert die zugrunde liegenden Daten und die daraus resultierende verrauschte Ausgabe.
Hauptstrategie C
Der Anbieter von Anzeigentechnologien beschließt, vier Schlüssel für alle seine Werbekunden zu erstellen und sie nach Währung x Werbetreibendem zu trennen. Branche:
Schlüssel 1 (USD × Werbetreibende für High-End-Schmuck) |
Schlüssel 2 (JPY x Werbetreibende für High-End-Schmuck) |
Schlüssel 3 (USD × Werbetreibende mit Einzelhandelsbezug für Bekleidung) |
Schlüssel 4 (JPY x Einzelhändler für Bekleidung) |
|
---|---|---|---|---|
Max. aggregierter Wert | 40.000 $ | 5.000.000 Yen | 500 € | 65.000 Yen |
Kaufwertbereich | [10.000–40.000] | [1.250.000–5.000.000] | [120–500] | [15.000–65.000] |
Das Ergebnis von Hauptstrategie C ist weniger verfälscht als bei Strategie B, da Die Kaufwerte von Werbetreibenden sind nicht gleichmäßig auf die Werbetreibenden verteilt. Für Zum Beispiel, wie die Kombination von Anschaffungen von hochwertigem Schmuck und Anschaffungen für Baseballkappen ändern die zugrunde liegenden Daten und damit die Ausgabe.
Erstellen Sie gemeinsame Maximalwerte und Skalierungsfaktoren. auf Gemeinsamkeiten zwischen mehreren Werbetreibenden hin, um Missverständnisse bei den . Sie können beispielsweise mit verschiedenen Strategien unten für Ihre Werbetreibenden:
- Eine Strategie, getrennt nach Währung (USD, ¥, CAD usw.)
- Eine Strategie, getrennt nach Branche (Versicherung, Automobil, Einzelhandel usw.)
- Eine Strategie, getrennt nach ähnlichen Kaufwertbereichen ([100], [1000], [10000] usw.)
Durch die Entwicklung wichtiger Strategien rund um die Gemeinsamkeiten, Schlüssel und einfacher zu verwalten und die Signal-Rausch-Verhältnisse höher liegen. Verschiedene Strategien bei unterschiedlichen Werbetreibenden testen Gemeinsamkeiten, um Wendepunkte bei der Maximierung der Auswirkungen von Geräuschen im Vergleich zum Code aufzudecken zu verstehen.
Erweiterte Ausreißerverwaltung
Betrachten wir ein Szenario mit zwei Werbetreibenden:
- Werbetreibender A:
- Der Kaufpreis für alle Produkte auf der Website des Werbetreibenden A liegen zwischen [$120 - $1.000] für einen Bereich von $880.
- Die Kaufpreise sind gleichmäßig über die 880 $-Spanne verteilt ohne Ausreißer, die außerhalb von zwei Standardabweichungen vom Medianwert des Kaufpreises liegen.
- Werbetreibender B:
- Der Kaufpreis für alle Produkte auf der Website des Werbetreibenden B liegen zwischen [$120 - $1.000] für einen Bereich von $880.
- Die Kaufpreise sind stark in der Spanne von 120 $bis 500 $ verlagert, Dabei lagen nur 5% der Käufe im Bereich von 500 bis 1.000 €.
In Anbetracht der Anforderungen an das Beitragsbudget und der Methodik, mit der auf die Endergebnisse Rauschen angewendet wird, ist das Ergebnis des Werbetreibenden B standardmäßig lauter als da der Werbetreibende B ein größeres Potenzial für Ausreißer hat, zugrunde liegende Berechnungen.
Sie können dieses Problem durch eine bestimmte Schlüsseleinrichtung umgehen. Wichtige Strategien testen um Ausreißerdaten zu verwalten und die Kaufwerte gleichmäßiger zu verteilen innerhalb des gesamten Kaufbereichs des Schlüssels.
Für den Werbetreibenden B könnten Sie zwei separate Schlüssel erstellen, um zwei verschiedene Kaufwertbereichen. In diesem Beispiel hat die Anzeigentechnologie festgestellt, dass Ausreißer die über dem Kaufwert von 500 € erscheinen. Implementieren Sie zwei separate Schlüssel für diesem Werbetreibenden:
- Schlüsselstruktur 1 : Schlüssel, der nur Käufe zwischen den zwischen 120 $und 500 $ (ca. 95% des gesamten Kaufvolumens).
- Schlüsselstruktur 2: Schlüssel, der nur Käufe über 500 € abdeckt Das entspricht etwa 5% der Gesamtkäufe.
Durch die Implementierung dieser Schlüsselstrategie können Lärm für den Werbetreibenden B und um den Nutzen aus zusammenfassenden Berichten zu maximieren. Da die neue kleinere sollten Schlüssel A und Schlüssel B nun eine einheitlichere Verteilung der Daten haben. für den jeweiligen Schlüssel des vorherigen Schlüssels. Dies führt zu weniger Rauschen in der Ausgabe jedes Schlüssels als für den vorherigen Schlüssel.