Informacje o szumach w raportach podsumowujących

Dowiedz się, co oznacza szum, gdzie jest dodawany i jak wpływa na wyniki pomiarowe.

Raporty podsumowujące są wynikiem agregacji raportów zbiorczych. Gdy raporty agregujące są grupowane przez kolektor i przetwarzane przez usługę agregacji, do wynikowych raportów podsumowujących dodawany jest szum (losowa ilość danych). Wprowadzany jest szum, aby chronić prywatność użytkownika. Celem tego mechanizmu jest stworzenie platformy umożliwiającej pomiar prywatności różnicowej.

Szum jest dodawany w ostatecznym raporcie podsumowującym.

Wprowadzenie do szumu w raportach podsumowujących

Dodanie szumu zazwyczaj nie jest obecnie częścią pomiaru skuteczności reklam, ale w wielu przypadkach nie wpłynie istotnie na interpretację wyników.

Warto zastanowić się nad tym w ten sposób: Czy jesteś pewny, że podejmiesz decyzję na podstawie konkretnych danych, jeśli dane nie będą szkodliwe?

Czy na przykład reklamodawca mógłby być pewny, że będzie chciał zmienić strategię kampanii lub budżety, biorąc pod uwagę fakt, że w kampanii A było 15 konwersji, a w kampanii B – 16?

Jeśli odpowiedź jest przecząca, szum nie ma znaczenia.

Należy skonfigurować korzystanie z interfejsu API w taki sposób, aby:

  1. Odpowiedź na powyższe pytanie brzmi „tak”.
  2. Zarządzanie szumem w sposób, który nie wpływa znacząco na Twoją zdolność do podjęcia decyzji na podstawie określonych danych. Oto, co możesz zrobić: przy oczekiwanej minimalnej liczbie konwersji warto utrzymać szum w zbieranych danych poniżej określonego procentu.

W tej i dalszej części omawiamy strategie, które pozwolą osiągnąć 2.

Podstawowe pojęcia

Usługa agregacji dodaje szum do każdej wartości podsumowania – czyli raz na klucz – za każdym razem, gdy wymagane jest wygenerowanie raportu podsumowującego.

Te wartości szumu są losowo wybierane na podstawie określonego rozkładu prawdopodobieństwa, który omówiliśmy poniżej.

Wszystkie elementy, które mają wpływ na szum, opierają się na 2 głównych koncepcjach.

  1. Rozkład szumu (szczegóły poniżej) jest taki sam niezależnie od wartości podsumowania (niskiej czy wysokiej). Dlatego im wyższa wartość podsumowania, tym mniejszy wpływ, jaki może mieć szum w odniesieniu do tej wartości.

    Załóżmy na przykład, że łączna łączna wartość zakupów wynosząca 20 tys. zł i łączna łączna wartość zakupu wynosząca 200 zł podlegają szumowi wybranemu z tej samej dystrybucji.

    Załóżmy, że szum z tego rozkładu mieści się w zakresie od -100 do +100.

    • W przypadku łącznej wartości zakupu wynoszącej 20 000 zł szum waha się w przedziale od 0 do 100/20 000=0,5%.
    • W przypadku podsumowania wartości zakupu wynoszącej 200 zł szum waha się od 0 do 100/200=50%.

    W związku z tym szum może mieć mniejszy wpływ na łączną wartość zakupu w wysokości 20 000 zł niż na wartość 200 zł. 20 000 USD prawdopodobnie będzie mniej szumów, co oznacza wyższy stosunek sygnału do szumu.

    Wyższe wartości zagregowane mają względnie mniejszy wpływ na szum.

    Ma to kilka ważnych konsekwencji praktycznych, które opisujemy w następnej sekcji. Ten mechanizm jest częścią projektu interfejsu API, a jego praktyczne skutki mają długoterminowy charakter. Będą one nadal odgrywać ważną rolę w projektowaniu i ocenie różnych strategii agregacji przez specjalistów z branży technologii reklamowych.

  2. Choć szum jest pobierany z tego samego rozkładu, niezależnie od wartości podsumowania, rozkład ten zależy od kilku parametrów. Jeden z tych parametrów (epsilon) może zostać zmieniony przez technologie reklamowe podczas zakończonych testów origin w celu oceny różnych dostosowań przydatności/prywatności. Możliwość dostosowywania wartości ypsilon należy jednak traktować jako tymczasową. Chętnie poznamy Twoją opinię o Twoich przypadkach użycia i wartościach wartości ypsilon, które dobrze się sprawdzają.

Chociaż firma z branży technologii reklamowych nie ma bezpośredniej kontroli nad sposobem dodawania szumu, może wpływać na wpływ szumu na dane pomiarowe. W kolejnych sekcjach dowiesz się, jak w praktyce może to wpłynąć na szum.

Zanim jednak to zrobimy, przyjrzyjmy się bliżej sposobie stosowania szumu.

Powiększanie: sposób stosowania szumu

1 dystrybucja szumu

Szum jest pobierany na podstawie rozkładu Laplace'a z tymi parametrami:

  • Średnia (μ) o wartości 0. Oznacza to, że najbardziej prawdopodobna wartość szumu wynosi 0 (bez dodanego szumu), a wartość zaszumionego szumu jest równie prawdopodobna, aby była mniejsza od oryginału, co większa (czasem nazywana jest bezstronnym).
  • Parametr skali o wartości b = CONTRIBUTION_BUDGET / epsilon.
    • Pole CONTRIBUTION_BUDGET jest zdefiniowane w przeglądarce.
    • Ustawienie epsilon jest naprawione na serwerze agregacji.

Poniższy diagram przedstawia funkcję gęstości prawdopodobieństwa dla rozkładu Laplace'a z μ=0, b = 20:

Funkcja gęstości prawdopodobieństwa dla rozkładu Laplace'a z μ=0, b = 20

Losowe wartości szumu, jeden rozkład szumu

Załóżmy, że technologia reklamowa żąda raportów podsumowujących dotyczące 2 kluczy agregacji: klucz1 i klucz2.

Usługa agregacji wybiera 2 wartości szumu (x1 i x2) zgodnie z takim samym rozkładem szumu. Wartość x1 jest dodawana do wartości podsumowania klucza1, a x2 do wartości podsumowania klucza2.

Wartości szumu na diagramach przedstawimy jako identyczne. To tylko uproszczenie. W rzeczywistości wartości szumu mogą być różne, ponieważ są pobierane losowo z rozkładu.

Pokazuje to, że wszystkie wartości szumu pochodzą z tego samego rozkładu i są niezależne od wartości podsumowania, do której są zastosowane.

Inne właściwości szumu

Szum jest stosowany do każdej wartości podsumowania – także do pustych wartości (0).

Nawet puste wartości podsumowania mogą być źródłem szumu.

Na przykład nawet jeśli rzeczywista wartość podsumowania dla danego klucza wynosi 0, zaszumiona wartość podsumowania w raporcie podsumowującym dla tego klucza najprawdopodobniej będzie inna niż 0.

Szum może być liczbą dodatnią lub ujemną.

Przykłady szumu pozytywnego i negatywnego

Na przykład przy kwocie zakupu przed szumem wynoszącym 327 000 szum może wynosić +6000 lub -6000 (są to dowolne wartości przykładowe).

Ocena szumu

Obliczam odchylenie standardowe szumu

Odchylenie standardowe szumu to:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Przykład

Jeśli wartość ypsilon = 10, odchylenie standardowe szumu wynosi:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Ocenianie, kiedy różnice w pomiarach są istotne

Znasz odchylenie standardowe szumu dodanego do każdej wartości wyjściowej przez usługę agregacji, więc możesz określić odpowiednie wartości progowe do porównania, by sprawdzić, czy zaobserwowane różnice mogą być spowodowane szumem.

Jeśli na przykład szum dodany do wartości wynosi około +/- 10 (z uwzględnieniem skalowania), a różnica w wartości między 2 kampaniami przekracza 100, można bezpiecznie stwierdzić, że różnica w wartości mierzonej między poszczególnymi kampaniami nie wynika tylko z szumu.

Engage and share feedback

You can participate and experiment with this API.

Dalsze kroki