Descubre qué significa el ruido, dónde se agrega y cómo afecta a tus esfuerzos de medición.
Los informes de resumen son el resultado de la agregación de informes agregables. Cuando un recopilador procesa los informes agregables y los procesa el servicio de agregación, se agrega ruido (una cantidad aleatoria de datos) a los informes de resumen resultantes. Se agrega ruido para proteger la privacidad del usuario. El objetivo de este mecanismo es contar con un framework que pueda admitir mediciones privadas diferenciales.
Introducción al ruido en los informes de resumen
Si bien agregar ruido no suele formar parte de la medición de los anuncios en la actualidad, en muchos casos, el ruido agregado no cambiará sustancialmente la forma en que interpretas tus resultados.
Puede ser útil pensar en ello de la siguiente manera: ¿Estaría seguro de tomar una decisión basada en un determinado dato si esos datos no fueran ruidosos?
Por ejemplo, ¿un anunciante podría estar seguro de cambiar la estrategia o los presupuestos de su campaña si la campaña A tiene 15 conversiones y la campaña B obtuvo 16?
Si la respuesta es no, el ruido es irrelevante.
Lo que deberás hacer es configurar el uso de la API de modo que se cumpla lo siguiente:
- La respuesta a la pregunta anterior es sí.
- El ruido se administra de una manera que no afecta significativamente tu capacidad para tomar una decisión en función de ciertos datos. Puedes tratar esto de la siguiente manera: para una cantidad mínima esperada de conversiones, debes mantener el ruido en la métrica recopilada por debajo de un determinado porcentaje.
En esta sección y a continuación, describiremos estrategias para lograr 2.
Conceptos básicos
El servicio de agregación agrega ruido una vez a cada valor de resumen (es decir, una vez por clave) cada vez que se solicita un informe de resumen.
Estos valores de ruido se extraen de forma aleatoria de una distribución de probabilidad específica, que se analiza a continuación.
Todos los elementos que influyen en el ruido se basan en dos conceptos principales.
La distribución de ruido (más detalles a continuación) es la misma, independientemente del valor de resumen, ya sea bajo o alto. Por lo tanto, cuanto más alto sea el valor de resumen, menor es el impacto probable que el ruido tenga en relación con este valor.
Por ejemplo, supongamos que un valor de compra total agregado de USD 20,000 y un valor de compra total agregado de USD 200 están sujetos al ruido seleccionado de la misma distribución.
Supongamos que el ruido de esta distribución varía aproximadamente entre -100 y +100.
- Para el valor de compra resumido de USD 20,000, el ruido varía entre 0 y 100/20,000=0.5%.
- Para el valor de compra resumido de USD 200, el ruido varía entre 0 y 100/200=50%.
Por lo tanto, es probable que la información irrelevante tenga un impacto menor en el valor de compra agregado de USD 20,000 que en el valor de USD 200. En términos relativos, es probable que USD 20,000 sean menos ruidosos, es decir, es probable que tengan una relación señal-ruido más alta.
Esto tiene algunas implicaciones prácticas importantes que se describen en la siguiente sección. Este mecanismo forma parte del diseño de la API y las implicaciones prácticas son a largo plazo. Seguirán desempeñando un papel importante a la hora de diseñar y evaluar varias estrategias de agregación.
Si bien el ruido se obtiene de la misma distribución, independientemente del valor de resumen, esa distribución depende de varios parámetros. Uno de estos parámetros, épsilon, podría ser alterado por las tecnologías publicitarias durante la prueba de origen concluida para evaluar varios ajustes de utilidad y privacidad. Sin embargo, considera la capacidad de ajustar el parámetro épsilon como temporal. Agradecemos tus comentarios sobre tus casos de uso y los valores de épsilon que funcionan bien.
Si bien una empresa de tecnología publicitaria no controla directamente las formas en que se agrega ruido, puede influir en el impacto del ruido en sus datos de medición. En las siguientes secciones, analizaremos cómo el ruido puede influir en la práctica.
Antes de hacerlo, veamos en detalle la forma en que se aplica el ruido.
Acercamiento: cómo se aplica el ruido
Una distribución de ruido
El ruido se obtiene de la distribución de Laplace, con los siguientes parámetros:
- Una media (
μ
) de 0 Esto significa que el valor de ruido más probable es 0 (sin ruido agregado) y que el valor ruidoso probablemente sea más pequeño que el original y más grande (a veces, esto se denomina imparcial). - Un parámetro de escala de
b = CONTRIBUTION_BUDGET
/epsilon
.CONTRIBUTION_BUDGET
se define en el navegador.epsilon
se corrige en el servidor de agregación.
El siguiente diagrama muestra la función de densidad de probabilidad para una distribución de Laplace con μ=0, b = 20:
Valores de ruido aleatorios, una distribución de ruido
Supongamos que una tecnología publicitaria solicita informes de resumen para dos claves de agregación: key1 y key2.
El servicio de agregación selecciona dos valores de ruido x1 y x2, según la misma distribución de ruido. x1 se suma al valor de resumen de key1 y x2 se agrega al valor de resumen de key2.
En los diagramas, representaremos los valores de ruido como idénticos. Esta es una simplificación; En realidad, los valores de ruido variarán, ya que se extraen de forma aleatoria de la distribución.
Esto demuestra que todos los valores de ruido provienen de la misma distribución y son independientes del valor de resumen al que se aplican.
Otras propiedades del ruido
El ruido se aplica a todos los valores de resumen, incluidos los vacíos (0).
Por ejemplo, incluso si el verdadero valor de resumen de una clave determinada es 0, el valor de resumen ruidoso que verás en el informe de resumen para esta clave (lo más probable) no será 0.
El ruido puede ser un número positivo o negativo.
Por ejemplo, para un importe de compra previo al ruido de 327,000, el ruido puede ser +6,000 o -6,000 (estos son valores de ejemplo arbitrarios).
Evaluación del ruido
Calcula la desviación estándar del ruido
La desviación estándar del ruido es la siguiente:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Ejemplo
Con épsilon = 10, la desviación estándar del ruido es la siguiente:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Evaluar cuando las diferencias de medición son significativas
Debido a que conocerás la desviación estándar del ruido que agrega el valor de salida del servicio de agregación, puedes determinar los umbrales adecuados para la comparación y determinar si las diferencias observadas podrían deberse al ruido.
Por ejemplo, si el ruido agregado a un valor es aproximadamente +/- 10 (teniendo en cuenta el escalamiento) y la diferencia en el valor entre dos campañas es superior a 100, es probable que sea seguro concluir que la diferencia en el valor medido entre cada campaña no se debe solo al ruido.
Engage and share feedback
You can participate and experiment with this API.
- Read about aggregatable reports and the aggregation service, ask questions, and suggest feedback.
- Read the Attribution reporting guides.
- Ask questions and join discussions on the Privacy Sandbox Developer Support repo.
Próximos pasos
- Si quieres conocer las variables que puedes controlar para mejorar la relación señal/ruido, consulta Cómo trabajar con ruido.
- Revisa Experimenta con decisiones de diseño de informes de resumen para obtener ayuda con la planificación de tus estrategias de informes de agregación.
- Prueba el lab de ruido.