Scopri come utilizzare, tenere conto e ridurre l'impatto del rumore nei report aggregabili.
Prima di iniziare
Prima di procedere, per comprendere meglio il rumore e il suo impatto, consulta Comprendere il rumore nei report di riepilogo.
I tuoi controlli per il rumore
Anche se non puoi controllare direttamente il rumore aggiunto ai report aggregabili, ci sono alcuni passaggi che puoi seguire per ridurne al minimo gli effetti. Le sezioni seguenti spiegano queste strategie.
Fai lo scale up fino al budget per il contributo
Come spiegato in Comprendere il rumore, il rumore applicato al valore di riepilogo per ogni chiave si basa sulla scala 0-65.536 (0-CONTRIBUTION_BUDGET
).
Per questo motivo, per massimizzare l'indicatore in relazione al rumore, devi scalare verso l'alto ogni valore prima di impostarlo come valore aggregabile, ovvero moltiplicare ciascun valore per un determinato fattore, il fattore di scalabilità, garantendo al contempo che rimanga entro il budget del contributo.
Calcolo di un fattore di scalabilità
Il fattore di scalabilità rappresenta quanto vuoi scalare un valore aggregabile. Il suo valore dovrebbe essere il budget per il contributo diviso per il valore massimo aggregabile per una determinata chiave.
Ad esempio, supponiamo che gli inserzionisti vogliano conoscere il valore di acquisto totale. Sai che il valore di acquisto massimo previsto per ogni singolo acquisto è pari a 2000 €, fatta eccezione per alcuni valori anomali che decidi di ignorare:
- Calcola il fattore di scalabilità:
- Per massimizzare il rapporto segnale-rumore, devi scalare questo valore a 65.536 (budget per il contributo).
- Ciò si traduce in un fattore di scalabilità di circa 32x pari a 65.536 / 2000. In pratica, puoi arrotondare questo fattore per eccesso o per difetto.
- Fai lo scale up dei valori prima dell'aggregazione. Per ogni $1 di acquisto, incrementa la metrica monitorata di 32. Ad esempio, per un acquisto di 120$, imposta un valore aggregabile di 120*32 = 3840.
- Fai lo scale down dei valori dopo l'aggregazione. Una volta ricevuto il report di riepilogo che contiene il valore di acquisto sommato per più utenti, fai lo scale down del valore di riepilogo utilizzando il fattore di scalabilità utilizzato prima dell'aggregazione. Nel nostro esempio, abbiamo utilizzato un fattore di scalabilità pari a 32 per la preaggregazione, quindi dobbiamo dividere per 32 il valore di riepilogo ricevuto nel report di riepilogo. Pertanto, se il valore di acquisto di riepilogo per una determinata chiave nel report di riepilogo è 76.800, il valore di acquisto di riepilogo (con rumore) è 76.800/32 = $2400.
Suddividi il budget
Se hai diversi obiettivi di misurazione, ad esempio conteggio degli acquisti e valore di acquisto, ti consigliamo di suddividere il budget tra questi obiettivi.
In questo caso, i fattori di scalabilità saranno diversi per diversi valori aggregabili, a seconda del massimo previsto di un valore aggregabile.
Per informazioni dettagliate, consulta la sezione Informazioni sulle chiavi di aggregazione.
Ad esempio, supponiamo che tu stia monitorando sia il conteggio degli acquisti sia il valore degli acquisti e che tu decida di allocare il budget equamente.
65.536 / 2 = 32.768 possono essere assegnati per tipo di misurazione e per origine.
- Numero di acquisti:
- Stai monitorando un solo acquisto, pertanto il numero massimo di acquisti per una determinata conversione è 1.
- Pertanto, si decide di impostare il fattore di scala per il conteggio acquisti su 32.768 / 1 = 32.768.
- Valore di acquisto:
- Supponiamo che il valore di acquisto massimo previsto per ogni singolo acquisto sia pari a 2000 €.
- Pertanto, si decide di impostare il fattore di scala per il valore di acquisto su 32.768 / 2.000 = 16,384 o circa 16.
Chiavi di aggregazione più approssimative migliorano il rapporto segnale-rumore
Poiché le chiavi generiche catturano più eventi di conversione rispetto alle chiavi granulari, in genere le chiavi generiche portano a valori di riepilogo più elevati.
I valori di riepilogo più elevati sono meno influenzati dal rumore rispetto ai valori più bassi; il rumore su questi valori è probabilmente più basso rispetto a questo valore.
È probabile che i valori raccolti con chiavi più generiche siano relativamente meno fragili rispetto ai valori raccolti con chiavi più granulari.
Esempio
Tutte le altre chiavi rimangono uguali: una chiave che monitora il valore di acquisto a livello globale (sommato in tutti i paesi) genera un valore di acquisto di riepilogo più elevato (e un numero di conversioni riepilogativo più elevato) rispetto a una chiave che monitora le conversioni a livello di paese.
Di conseguenza, il rumore relativo sul valore totale di acquisto di un paese specifico sarà superiore a quello sul valore di acquisto totale di tutti i paesi.
Analogamente, tutti i prodotti sono uguali: il valore totale di acquisto delle scarpe è inferiore al valore di acquisto totale di tutti gli articoli (incluse le scarpe).
Di conseguenza, il rumore relativo sul valore totale di acquisto per le scarpe sarà superiore a quello sul valore di acquisto totale di tutti gli articoli.
La somma dei valori di riepilogo (aggregazioni) somma anche il rumore
Sommando i valori di riepilogo dei report di riepilogo per accedere a dati di livello superiore, somma anche il rumore di questi valori.
Esaminiamo due diversi approcci: - Approccio A: includi un ID area geografica nelle tue chiavi. I report di riepilogo espongono le chiavi a livello di ID geografico, ciascuna associata al valore di acquisto di riepilogo a uno specifico livello di ID geografico. - Approccio B: non includi l'ID area geografica nelle chiavi. I report di riepilogo espongono direttamente il valore di acquisto di riepilogo per tutte le località / ID area geografica.
Per accedere al valore di acquisto a livello di paese: - Con l'approccio A, somma i valori di riepilogo a livello di ID geografico e di conseguenza anche il rumore. In questo modo è probabile che venga aggiunto altro rumore al valore di acquisto finale a livello di ID geografico. - Con l'approccio B, esamini direttamente i dati esposti nei report di riepilogo. Il rumore è stato aggiunto solo una volta a questi dati.
Di conseguenza, è probabile che il valore di acquisto di riepilogo per un determinato ID geografico sia più rumoroso con l'approccio A.
Analogamente, l'inclusione di una dimensione a livello di codice postale nelle chiavi potrebbe portare a risultati più "sporchi" rispetto all'uso di chiavi più approssimative con una dimensione a livello di regione.
L'aggregazione per periodi di tempo più lunghi aumenta il rapporto segnale-rumore
La richiesta di report di riepilogo con minore frequenza significa che ogni valore di riepilogo sarà probabilmente più elevato rispetto a quanto accadrebbe con maggiore frequenza rispetto alla richiesta di report di riepilogo. È probabile che si verifichino più conversioni in periodi di tempo più lunghi.
Come accennato in precedenza, più alto è il valore di riepilogo, più basso è probabilmente il rumore relativo. Di conseguenza, richiedere report di riepilogo meno frequentemente porta a un rapporto segnale/rumore più elevato (migliore).
Per spiegare meglio, ecco un esempio:
- Se richiedi report di riepilogo orari su 24 ore e successivamente somma il valore di riepilogo di ogni report per accedere ai dati a livello di giorno, il rumore viene aggiunto 24 volte.
- In un report di riepilogo giornaliero, il rumore viene aggiunto una sola volta.
Epsilon più alto, rumore più basso
Maggiore è il valore di epsilon, minori sono il rumore e la protezione della privacy.
Sfruttare filtri e deduplicazione
Una parte importante dell'allocazione del budget tra chiavi diverse è comprendere quante volte può verificarsi un determinato evento. Ad esempio, un inserzionista potrebbe essere interessato a un solo acquisto per ogni clic, ma potrebbe essere interessato a un massimo di 3 conversioni di tipo "visualizzazione di pagina del prodotto". Per supportare questi casi d'uso, ti consigliamo di sfruttare le seguenti funzionalità API che ti consentono di controllare quanti report vengono generati e quali conversioni vengono conteggiate:
- Filtri. Scopri di più sui filtri.
- Deduplicazione. Scopri di più sulla deduplicazione.
Sperimentazione con Epsilon
Gli ad tech possono impostare epsilon su un valore maggiore di 0 e fino a 64 incluso. Questo intervallo consente test flessibili. Valori più bassi di epsilon offrono una maggiore protezione della privacy. Ti consigliamo di iniziare con epsilon=10.
Consigli per l'esperimento
Ti consigliamo di: - Iniziare con epsilon = 10. - Nel caso in cui questo causi problemi significativi all'utilità, aumentare epsilon in modo incrementale. - Condividi il tuo feedback su specifici punti di svolta che potresti trovare in merito all'usabilità dei dati.
Interagisci e condividi il tuo feedback
Puoi partecipare e sperimentare con questa API.
- Scopri di più sui report aggregabili e sul servizio di aggregazione, fai domande e suggerisci feedback.
- Leggi le guide ai report sull'attribuzione.
- Fai domande e partecipa alle discussioni nel repository dell'assistenza per gli sviluppatori Privacy Sandbox.
Passaggi successivi
- Per ulteriori informazioni sui fattori che influenzano i report, ad esempio le variabili di campagna, la frequenza di raggruppamento e la granularità delle dimensioni, consulta Sperimentare le decisioni di progettazione dei report di riepilogo .
- Prova il laboratorio.