Dowiedz się, co oznacza szum, gdzie jest dodawany i jak wpływa na wyniki pomiarowe.
Raporty podsumowujące są wynikiem agregacji raportów zbiorczych. Gdy raporty agregujące są grupowane przez kolektor i przetwarzane przez usługę agregacji, do wynikowych raportów podsumowujących dodawany jest szum (losowa ilość danych). Wprowadzany jest szum, aby chronić prywatność użytkownika. Celem tego mechanizmu jest stworzenie platformy umożliwiającej pomiar prywatności różnicowej.
Wprowadzenie do szumu w raportach podsumowujących
Dodanie szumu zazwyczaj nie jest obecnie częścią pomiaru skuteczności reklam, ale w wielu przypadkach nie wpłynie istotnie na interpretację wyników.
Warto zastanowić się nad tym w ten sposób: Czy jesteś pewny, że podejmiesz decyzję na podstawie konkretnych danych, jeśli dane nie będą szkodliwe?
Czy na przykład reklamodawca mógłby być pewny, że będzie chciał zmienić strategię kampanii lub budżety, biorąc pod uwagę fakt, że w kampanii A było 15 konwersji, a w kampanii B – 16?
Jeśli odpowiedź jest przecząca, szum nie ma znaczenia.
Należy skonfigurować korzystanie z interfejsu API w taki sposób, aby:
- Odpowiedź na powyższe pytanie brzmi „tak”.
- Zarządzanie szumem w sposób, który nie wpływa znacząco na Twoją zdolność do podjęcia decyzji na podstawie określonych danych. Oto, co możesz zrobić: przy oczekiwanej minimalnej liczbie konwersji warto utrzymać szum w zbieranych danych poniżej określonego procentu.
W tej i dalszej części omawiamy strategie, które pozwolą osiągnąć 2.
Podstawowe pojęcia
Usługa agregacji dodaje szum do każdej wartości podsumowania – czyli raz na klucz – za każdym razem, gdy wymagane jest wygenerowanie raportu podsumowującego.
Te wartości szumu są losowo wybierane na podstawie określonego rozkładu prawdopodobieństwa, który omówiliśmy poniżej.
Wszystkie elementy, które mają wpływ na szum, opierają się na 2 głównych koncepcjach.
Rozkład szumu (szczegóły poniżej) jest taki sam niezależnie od wartości podsumowania (niskiej czy wysokiej). Dlatego im wyższa wartość podsumowania, tym mniejszy wpływ, jaki może mieć szum w odniesieniu do tej wartości.
Załóżmy na przykład, że łączna łączna wartość zakupów wynosząca 20 tys. zł i łączna łączna wartość zakupu wynosząca 200 zł podlegają szumowi wybranemu z tej samej dystrybucji.
Załóżmy, że szum z tego rozkładu mieści się w zakresie od -100 do +100.
- W przypadku łącznej wartości zakupu wynoszącej 20 000 zł szum waha się w przedziale od 0 do 100/20 000=0,5%.
- W przypadku podsumowania wartości zakupu wynoszącej 200 zł szum waha się od 0 do 100/200=50%.
W związku z tym szum może mieć mniejszy wpływ na łączną wartość zakupu w wysokości 20 000 zł niż na wartość 200 zł. 20 000 USD prawdopodobnie będzie mniej szumów, co oznacza wyższy stosunek sygnału do szumu.
Ma to kilka ważnych konsekwencji praktycznych, które opisujemy w następnej sekcji. Ten mechanizm jest częścią projektu interfejsu API, a jego praktyczne skutki mają długoterminowy charakter. Będą one nadal odgrywać ważną rolę w projektowaniu i ocenie różnych strategii agregacji przez specjalistów z branży technologii reklamowych.
Choć szum jest pobierany z tego samego rozkładu, niezależnie od wartości podsumowania, rozkład ten zależy od kilku parametrów. Jeden z tych parametrów (epsilon) może zostać zmieniony przez technologie reklamowe podczas zakończonych testów origin w celu oceny różnych dostosowań przydatności/prywatności. Możliwość dostosowywania wartości ypsilon należy jednak traktować jako tymczasową. Chętnie poznamy Twoją opinię o Twoich przypadkach użycia i wartościach wartości ypsilon, które dobrze się sprawdzają.
Chociaż firma z branży technologii reklamowych nie ma bezpośredniej kontroli nad sposobem dodawania szumu, może wpływać na wpływ szumu na dane pomiarowe. W kolejnych sekcjach dowiesz się, jak w praktyce może to wpłynąć na szum.
Zanim jednak to zrobimy, przyjrzyjmy się bliżej sposobie stosowania szumu.
Powiększanie: sposób stosowania szumu
1 dystrybucja szumu
Szum jest pobierany na podstawie rozkładu Laplace'a z tymi parametrami:
- Średnia (
μ
) o wartości 0. Oznacza to, że najbardziej prawdopodobna wartość szumu wynosi 0 (bez dodanego szumu), a wartość zaszumionego szumu jest równie prawdopodobna, aby była mniejsza od oryginału, co większa (czasem nazywana jest bezstronnym). - Parametr skali o wartości
b = CONTRIBUTION_BUDGET
/epsilon
.- Pole
CONTRIBUTION_BUDGET
jest zdefiniowane w przeglądarce. - Ustawienie
epsilon
jest naprawione na serwerze agregacji.
- Pole
Poniższy diagram przedstawia funkcję gęstości prawdopodobieństwa dla rozkładu Laplace'a z μ=0, b = 20:
Losowe wartości szumu, jeden rozkład szumu
Załóżmy, że technologia reklamowa żąda raportów podsumowujących dotyczące 2 kluczy agregacji: klucz1 i klucz2.
Usługa agregacji wybiera 2 wartości szumu (x1 i x2) zgodnie z takim samym rozkładem szumu. Wartość x1 jest dodawana do wartości podsumowania klucza1, a x2 do wartości podsumowania klucza2.
Wartości szumu na diagramach przedstawimy jako identyczne. To tylko uproszczenie. W rzeczywistości wartości szumu mogą być różne, ponieważ są pobierane losowo z rozkładu.
Pokazuje to, że wszystkie wartości szumu pochodzą z tego samego rozkładu i są niezależne od wartości podsumowania, do której są zastosowane.
Inne właściwości szumu
Szum jest stosowany do każdej wartości podsumowania – także do pustych wartości (0).
Na przykład nawet jeśli rzeczywista wartość podsumowania dla danego klucza wynosi 0, zaszumiona wartość podsumowania w raporcie podsumowującym dla tego klucza najprawdopodobniej będzie inna niż 0.
Szum może być liczbą dodatnią lub ujemną.
Na przykład przy kwocie zakupu przed szumem wynoszącym 327 000 szum może wynosić +6000 lub -6000 (są to dowolne wartości przykładowe).
Ocena szumu
Obliczam odchylenie standardowe szumu
Odchylenie standardowe szumu to:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Przykład
Jeśli wartość ypsilon = 10, odchylenie standardowe szumu wynosi:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Ocenianie, kiedy różnice w pomiarach są istotne
Znasz odchylenie standardowe szumu dodanego do każdej wartości wyjściowej przez usługę agregacji, więc możesz określić odpowiednie wartości progowe do porównania, by sprawdzić, czy zaobserwowane różnice mogą być spowodowane szumem.
Jeśli na przykład szum dodany do wartości wynosi około +/- 10 (z uwzględnieniem skalowania), a różnica w wartości między 2 kampaniami przekracza 100, można bezpiecznie stwierdzić, że różnica w wartości mierzonej między poszczególnymi kampaniami nie wynika tylko z szumu.
Angażuj i dziel się opiniami
Możesz uczestniczyć w korzystaniu z tego interfejsu API i eksperymentować z nim.
- Poczytaj o raportach zbiorczych i usłudze agregacji, zadawaj pytania i zaproponuj swoją opinię.
- Przeczytaj przewodniki po raportowaniu atrybucji.
- Zadawaj pytania i dołączaj do dyskusji w repozytorium pomocy dla deweloperów Piaskownicy prywatności.
Dalsze kroki
- Informacje o tym, jakie zmienne możesz kontrolować, aby poprawić stosunek sygnału do szumu, znajdziesz w artykule Praca z szumem.
- Zapoznaj się z artykułem Eksperymentuj z decyzjami dotyczącymi projektu raportu podsumowującego, aby uzyskać pomoc w planowaniu strategii raportowania agregacji.
- Wypróbuj Noise Lab.