Entender o ruído nos relatórios de resumo

Saiba o que significa o ruído, onde ele é adicionado e como ele afeta suas iniciativas de medição.

Os relatórios de resumo são o resultado da agregação dos relatórios agregáveis. Quando os relatórios agregáveis são agrupados por um coletor e processados pelo serviço de agregação, o ruído, uma quantidade aleatória de dados, é adicionado aos relatórios de resumo resultantes. O ruído é adicionado para proteger a privacidade do usuário. O objetivo desse mecanismo é ter um framework que ofereça suporte à medição diferenciada.

O ruído é adicionado no relatório do resumo final.

Introdução ao ruído nos relatórios resumidos

Embora a adição de ruído geralmente não faça parte da medição dos anúncios, em muitos casos, o ruído adicionado não muda substancialmente a forma como você interpreta seus resultados.

Pode ser útil pensar sobre isso da seguinte maneira: Você estaria confiante para tomar uma decisão com base em uma determinada parte dos dados se eles não fossem ruidosos?

Por exemplo, um anunciante estaria confiante em alterar a estratégia ou os orçamentos de campanha, tendo como base o fato de que a Campanha A teve 15 conversões e a Campanha B teve 16?

Se a resposta for não, o ruído é irrelevante.

Configure o uso da API de modo que:

  1. A resposta para a pergunta acima é sim.
  2. O ruído é gerenciado de uma forma que não afete significativamente sua capacidade de tomar uma decisão com base em determinados dados. Você pode abordar isso da seguinte maneira: para um número mínimo esperado de conversões, você quer manter o ruído na métrica coletada abaixo de uma determinada porcentagem.

Nesta seção e na próxima, vamos descrever as estratégias para alcançar o número 2.

Principais conceitos

O serviço de agregação adiciona ruído uma vez a cada valor de resumo, ou seja, uma vez por chave, sempre que um relatório de resumo é solicitado.

Esses valores de ruído são extraídos aleatoriamente de uma distribuição de probabilidade específica, discutida abaixo.

Todos os elementos que afetam o ruído dependem de dois conceitos principais.

  1. A distribuição de ruído (detalhes abaixo) é a mesma, independentemente do valor do resumo, alto ou baixo. Portanto, quanto maior o valor de resumo, menor é o impacto provável do ruído em relação a esse valor.

    Por exemplo, suponha que um valor de compra total agregado de US $20.000 e um valor de compra total agregado de US $200 estejam sujeitos ao ruído selecionado da mesma distribuição.

    Vamos supor que o ruído dessa distribuição varie aproximadamente entre -100 e +100.

    • Para o valor de compra resumido de US $20.000, o ruído varia entre 0 e 100/20.000=0,5%.
    • Para o valor de compra resumido de US $200, o ruído varia entre 0 e 100/200=50%.

    Portanto, o ruído provavelmente terá um impacto menor no valor de compra agregado de US $20.000 do que no valor de US $200. Relativamente, US$ 20.000 tem menos ruído,ou seja, a relação sinal-ruído provavelmente é maior.

    Valores agregados maiores têm impacto de ruído relativamente menor.

    Isso tem algumas implicações práticas importantes que são descritas na próxima seção. Esse mecanismo faz parte do design da API e as implicações práticas são de longo prazo. Elas vão continuar tendo um papel importante quando as adtechs criarem e avaliarem várias estratégias de agregação.

  2. O ruído é extraído da mesma distribuição, independentemente do valor do resumo, mas essa distribuição depende de vários parâmetros. Um desses parâmetros, epsílon, pode ser alterado por adtechs durante o teste de origem concluído para avaliar vários ajustes de utilidade/privacidade. No entanto, considere a capacidade de ajustar épsilon como temporária. Agradecemos seu feedback sobre seus casos de uso e os valores de épsilon que funcionam bem.

Embora uma empresa de adtech não tenha controle direto das formas como o ruído é adicionado, ela pode influenciar o impacto dele nos dados de medição. Nas próximas seções, vamos nos aprofundar em como o ruído pode ser influenciado na prática.

Antes disso, vamos analisar como o ruído é aplicado.

Como aumentar o zoom: como o ruído é aplicado

Uma distribuição de ruído

O ruído é extraído da distribuição de Laplace, com os seguintes parâmetros:

  • Uma média (μ) de 0. Isso significa que o valor de ruído mais provável é 0 (sem ruído adicionado) e que o valor com ruído tem a mesma probabilidade de ser menor do que o original quanto maior. Isso às vezes é chamado de não enviesado.
  • Um parâmetro de escala de b = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET está definido no navegador.
    • epsilon foi corrigido no servidor de agregação.

O diagrama a seguir mostra a função de densidade de probabilidade para uma distribuição de Laplace com μ=0, b = 20:

Função de densidade de probabilidade para uma distribuição de Laplace com μ=0, b = 20

Valores de ruído aleatórios, uma distribuição de ruído

Vamos supor que uma adtech solicite relatórios de resumo para duas chaves de agregação, key1 e key2.

O serviço de agregação seleciona dois valores de ruído, x1 e x2, seguindo a mesma distribuição de ruído. x1 é adicionado ao valor de resumo para key1 e x2 é adicionado ao valor de resumo para key2.

Nos diagramas, representaremos os valores de ruído como idênticos. Isso é uma simplificação. na realidade, os valores de ruído variam, porque são extraídos aleatoriamente da distribuição.

Isso mostra que todos os valores de ruído vêm da mesma distribuição e são independentes do valor de resumo ao qual são aplicados.

Outras propriedades do ruído

O ruído é aplicado a todos os valores de resumo, incluindo os vazios (0).

Mesmo valores de resumo vazios estão sujeitos a ruído.

Por exemplo, mesmo que o valor de resumo verdadeiro de uma determinada chave seja 0, o valor de resumo com ruído que você verá no relatório de resumo dela (provavelmente) não será 0.

O ruído pode ser um número positivo ou negativo.

Exemplos de ruído positivo e negativo.

Por exemplo, para uma compra de pré-ruído de 327.000, o ruído pode ser +6.000 ou -6.000 (esses são valores de exemplo arbitrários).

Como avaliar ruídos

Como calcular o desvio padrão do ruído

O desvio padrão do ruído é:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Exemplo

Com épsilon = 10, o desvio padrão do ruído é:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Avaliar quando as diferenças de medição são significativas

Como você sabe o desvio padrão do ruído adicionado a cada valor resultante do serviço de agregação, é possível determinar os limites apropriados para comparação e determinar se as diferenças observadas podem ser causadas pelo ruído.

Por exemplo, se o ruído adicionado a um valor for de aproximadamente +/- 10 (considerando escalonamento) e a diferença no valor entre duas campanhas for superior a 100, é provável que a diferença no valor medido entre cada campanha não se deva apenas ao ruído.

Interaja e compartilhe feedback

Participe e experimente essa API.

Próximas etapas