Praca z hałasem

Dowiedz się, jak współpracować z szumem, uwzględniać go i ograniczać w raportach agregowanych.

Zanim zaczniesz

Zanim przejdziesz dalej, aby dowiedzieć się, co to jest szum i jego wpływ, przeczytaj artykuł Co to jest szum w raportach podsumowujących (w języku angielskim).

Kontrola szumów

Chociaż nie możesz bezpośrednio kontrolować szumu dodawanego do raportów agregowanych, możesz wykonać kilka czynności, aby zminimalizować ich skutki. Strategie te znajdziesz w sekcjach poniżej.

Skaluj w górę do budżetu darowizny

Jak wyjaśniliśmy w sekcji „Zrozumienie szumu”, szum stosowany do wartości podsumowania każdego klucza jest oparty na skali 0–65 536 (0–CONTRIBUTION_BUDGET).

Rozkład szumu jest oparty na budżecie.

Z tego względu, aby zmaksymalizować sygnał w stosunku do szumu, skaluj w górę każdą wartość, zanim ustawisz ją jako wartość agregowaną. Oznacza to mnożenie każdej wartości przez określony współczynnik (współczynnik skalowania), dbając jednocześnie o to, aby nie mieściła się w ramach budżetu darowizn.

Szum względny ze skalowaniem i bez niego.

Obliczanie współczynnika skalowania

Współczynnik skalowania określa, jak bardzo chcesz skalować daną wartość agregowaną. Jego wartością powinna być budżet darowizn podzielony przez maksymalną agregowaną wartość określonego klucza.

Określanie współczynnika skalowania na podstawie budżetu darowizn.

Załóżmy na przykład, że reklamodawcy chcą poznać łączną wartość zakupu. Wiesz,że maksymalna oczekiwana wartość zakupu pojedynczego zakupu to 2000 USD poza kilkoma wyjątkami, które decydujesz się zignorować:

  • Oblicz współczynnik skalowania:
    • Aby zmaksymalizować stosunek sygnału do szumu, musisz przeskalować tę wartość do 65 536 (budżet przekazany).
    • W wyniku otrzymujemy współczynnik skalowania na poziomie 65 536 (2000) wynoszący około 32x. W praktyce możesz zaokrąglić ten współczynnik w górę lub w dół.
  • Skaluj wartości przed agregacją. Za każde $1 zakupu zwiększ obserwowane dane o 32. Jeśli np. zakup wynosi 120 zł, ustaw wartość skumulowaną na 120*32 = 3840.
  • Skaluj wartości po zagregowaniu. Gdy otrzymasz raport podsumowujący, który zawiera wartość zakupu zsumowaną dla wielu użytkowników, zmniejsz wartość podsumowania przy użyciu współczynnika skalowania użytego przed agregacją. W naszym przykładzie użyliśmy współczynnika skalowania wstępnego 32, więc musimy podzielić wartość podsumowania otrzymaną w raporcie podsumowującym przez 32. Jeśli więc łączna wartość zakupu dla danego klucza w raporcie podsumowującym wynosi 76 800, łączna wartość zakupu (z szumem) wynosi 76 800/32 = 2400 zł.

Podziel budżet

Jeśli masz kilka celów pomiarowych, np. liczbę i wartość zakupów, warto podzielić budżet między nie.

W takim przypadku współczynniki skalowania będą różne dla różnych wartości agregowanych, co zależy od oczekiwanej maksymalnej wartości danej agregowanej wartości.

Szczegółowe informacje znajdziesz w artykule Omówienie kluczy agregacji.

Załóżmy np., że śledzisz zarówno liczbę zakupów, jak i ich wartość, i chcesz podzielić budżet po równo.

Na rodzaj pomiaru i źródła można przydzielić 65 536 / 2 = 32 768.

  • Liczba zakupów:
    • Śledzisz tylko jeden zakup, więc maksymalna liczba zakupów dla danej konwersji wynosi 1.
    • Dlatego postanawiasz ustawić współczynnik skalowania liczby zakupów na 32 768 / 1 = 32 768.
  • Wartość zakupu:
    • Załóżmy,że maksymalna oczekiwana wartość pojedynczego zakupu wynosi 2000 zł.
    • Dlatego postanawiasz ustawić współczynnik skalowania wartości zakupu na 32 768 / 2000 = 16,384, czyli około 16.

Bardziej szczegółowe klucze agregacji poprawiają stosunek sygnału do szumu

Klucze przybliżone rejestrują więcej zdarzeń konwersji niż klucze szczegółowe. Z tego powodu klucze przybliżone prowadzą zwykle do wyższych wartości zbiorczych.

Szum w mniejszym stopniu wpływa na wyższe wartości podsumowania niż na niższe wartości. szum na tych wartościach będzie prawdopodobnie mniejszy w porównaniu do tej wartości.

Wartości zbierane przy użyciu bardziej precyzyjnego klucza prawdopodobnie będą generować stosunkowo mniej szumów niż wartości gromadzone przy użyciu bardziej szczegółowych kluczy.

Przykład

Jeśli inne ustawienia są takie same, klucz, który śledzi wartość zakupu globalnie (sumowaną we wszystkich krajach) doprowadzi do wyższej łącznej wartości zakupu (i wyższej łącznej liczby konwersji) niż klucz śledzący konwersje na poziomie kraju.

W związku z tym szum względny dotyczący łącznej wartości zakupu w danym kraju będzie większy niż szum względny w przypadku łącznej wartości zakupu we wszystkich krajach.

I podobnie, gdy pozostałe są równe, łączna wartość zakupu butów jest niższa niż łączna wartość zakupu wszystkich produktów (w tym butów).

W związku z tym względny szum dotyczący łącznej wartości zakupu butów będzie większy niż szum względny w przypadku wszystkich produktów.

Wpływ szumu w przypadku klawiszy szczegółowych i przybliżonych.

Sumowanie wartości podsumowania (podsumowania) powoduje również zsumowanie szumu

Podsumowując wartości podsumowania z raportów podsumowujących, aby uzyskać dostęp do danych wyższego poziomu, możesz zsumować wartości wynikające z tych wartości.

Poziom szumu generowanego przez precyzyjne klawisze z podsumowaniem i przybliżonych klawiszy bez pełnego zakresu

Przyjrzyjmy się 2 różnym podejściom: – Metoda A: w kluczach umieszcza się identyfikator geograficzny. Raporty podsumowania zawierają klucze na poziomie identyfikatora geograficznego, z których każdy jest powiązany z podsumowaną wartością zakupu na poziomie określonego identyfikatora geograficznego. – Metoda B: klucze nie zawierają identyfikatora regionu. Raporty podsumowania bezpośrednio udostępniają podsumowanie wartości zakupu dla wszystkich identyfikatorów / lokalizacji geograficznych.

Aby uzyskać dostęp do wartości zakupu na poziomie kraju: – W metodzie A sumujemy wartości podsumowania na poziomie identyfikatora geograficznego, a tym samym sumuje się ich szum. Może to powodować większy szum w końcowej wartości zakupu na poziomie identyfikatora geograficznego. – W metodzie B należy sprawdzać dane widoczne w raportach podsumowujących. Szum został dodany do tych danych tylko raz.

W związku z tym podsumowanie wartości zakupu dla danego identyfikatora geograficznego może być bardziej niezgodne z prawdą, jeśli wybierzesz metodę A.

Analogicznie uwzględnienie wymiaru na poziomie kodu pocztowego w kluczach prawdopodobnie przyniesie bardziej niepożądane wyniki niż używanie mniej precyzyjnego klucza z wymiarem na poziomie regionu.

Agregacja w dłuższych okresach zwiększa stosunek sygnału do szumu

rzadsze wysyłanie próśb o raporty podsumowujące oznacza, że każda wartość podsumowania będzie prawdopodobnie wyższa niż w przypadku, gdy żądasz raportów częściej; jest bardziej prawdopodobny w dłuższym okresie.

Jak wspomnieliśmy wcześniej, im wyższa wartość podsumowania, tym mniejszy prawdopodobnie szum względny. Dlatego rzadziej prosząc o raporty podsumowujące, można uzyskać wyższy (lepszy) stosunek sygnału do szumu.

rzadsze wysyłanie próśb o raporty podsumowujące przekłada się na wyższy stosunek sygnału do szumu.

Oto przykład:

  • Jeśli chcesz uzyskać raport godzinowy z podsumowaniem dotyczącym ponad 24 godzin, a potem zsumujesz wartość z każdego raportu godzinowego, aby uzyskać dostęp do danych z całego dnia, szum jest dodawany 24 razy.
  • W jednym dziennym raporcie podsumowującym szum jest dodawany tylko raz.

Wyższa wartość ypsilon, niższy szum

Im wyższa wartość ypsilon, tym niższy poziom szumu i niższa ochrona prywatności.

Wykorzystanie filtrowania i usuwania duplikatów

Ważnym elementem przydzielania budżetu między różne klucze jest poznanie liczby wystąpień danego zdarzenia. Na przykład reklamodawcy mogą być zainteresowani tylko jednym zakupem na każde kliknięcie, ale mogą być zainteresowani maksymalnie 3 „wyświetleniami strony produktu”. konwersje. Aby obsługiwać takie przypadki użycia, możesz skorzystać z następujących funkcji interfejsu API, które umożliwiają kontrolowanie liczby generowanych raportów i zliczania konwersji:

Eksperymentowanie z wartością ypsilon

Dział technologii reklamowych może ustawić wartość ypsilon na wartość większą od 0 do 64 (włącznie). Ten zakres pozwala na elastyczne testowanie. Niższe wartości ypsilon zapewniają lepszą ochronę prywatności. Zalecamy rozpoczęcie od wartości epsilon=10.

Rekomendacje do eksperymentu

Zalecamy wykonanie tych czynności: – Zacznij od ypsilon = 10. – Jeśli powoduje to poważne problemy z użytecznością, stopniowo podnoś wartość ypsilon. – Podziel się opinią na temat konkretnych punktów przegięcia, które możesz napotkać w związku z użytecznością danych.

Engage and share feedback

You can participate and experiment with this API.

Dalsze kroki