Descubre qué significa el ruido, dónde se agrega y cómo afecta tus iniciativas de medición.
Los informes de resumen son el resultado de la agregación de informes agregables. Cuando un recopilador agrupa los informes agregables y los procesa el servicio de agregación, el ruido (una cantidad aleatoria de datos) se agrega a los informes de resumen resultantes. El ruido se agrega para proteger la privacidad del usuario. El objetivo de este mecanismo es tener un framework que admita la medición diferencialmente privada.
Introducción al ruido en los informes de resumen
Si bien agregar ruido no suele ser parte de la medición de anuncios actualmente, en muchos casos, ese ruido no cambiará sustancialmente la forma en que interpretas tus resultados.
Puede ser útil pensar en ello de la siguiente manera: ¿Confías en la decisión de tomar una decisión basada en cierto dato si esos datos no son ruidosos?
Por ejemplo, ¿un anunciante confiaría en cambiar la estrategia o los presupuestos de su campaña con base en el hecho de que la campaña A tuvo 15 conversiones y la campaña B tuvo 16?
Si la respuesta es no, el ruido es irrelevante.
Lo que debes hacer es configurar el uso de la API de manera que:
- La respuesta a la pregunta anterior es sí.
- El control del ruido se administra de una manera que no afecta significativamente tu capacidad para tomar una decisión basada en ciertos datos. Puedes abordar esto de la siguiente manera: para obtener una cantidad mínima esperada de conversiones, quieres mantener el ruido en la métrica recopilada por debajo de un porcentaje determinado.
En esta sección y en la siguiente, describiremos estrategias para lograr 2.
Conceptos básicos
El servicio de agregación agrega ruido una vez a cada valor de resumen (es decir, una vez por clave) cada vez que se solicita un informe de resumen.
Estos valores de ruido se obtienen de forma aleatoria a partir de una distribución de probabilidad específica, que se analiza a continuación.
Todos los elementos que afectan el ruido se basan en dos conceptos principales.
La distribución de ruido (más detalles a continuación) es la misma sin importar el valor del resumen, bajo o alto. Por lo tanto, cuanto más alto sea el valor del resumen, menor será el impacto que pueda tener el ruido en relación con este valor.
Por ejemplo, supongamos que un valor de compra agregado total de USD 20,000 y un valor de compra agregado total de USD 200 están sujetos a ruido seleccionado de la misma distribución.
Supongamos que el ruido de esta distribución varía aproximadamente entre -100 y +100.
- Para el valor resumido de la compra de USD 20,000, el ruido varía entre 0 y 100/20,000=0.5%.
- Para el valor resumido de la compra de USD 200, el ruido varía entre 0 y 100/200=50%.
Por lo tanto, es probable que el ruido tenga un menor impacto en el valor de compra agregado de USD 20,000 que en el valor de USD 200. En términos relativos, es probable que USD 20,000 sean menos ruidosos, lo que significa que es probable que tenga una relación señal-ruido más alta.
Esto tiene algunas implicaciones prácticas importantes que se describen en la siguiente sección. Este mecanismo forma parte del diseño de la API, y las implicaciones prácticas son a largo plazo. Seguirán desempeñando un papel importante cuando las tecnologías publicitarias diseñen y evalúen varias estrategias de agregación.
Si bien el ruido se extrae de la misma distribución, independientemente del valor del resumen, esa distribución depende de varios parámetros. Las tecnologías publicitarias podrían modificar uno de estos parámetros, épsilon, durante la prueba de origen concluida para evaluar varios ajustes de utilidad o privacidad. Sin embargo, considera la capacidad de modificar la épsilon como temporal. Agradecemos tus comentarios sobre tus casos de uso y los valores de épsilon que funcionan bien.
Si bien una empresa de tecnología publicitaria no tiene el control directo de las formas en que se agrega el ruido, puede influir en el impacto del ruido en sus datos de medición. En las próximas secciones, profundizaremos en cómo se puede influir en el ruido en la práctica.
Antes de hacerlo, veamos con más detalle la forma en que se aplica el ruido.
Acercamiento: Cómo se aplica el ruido
Una distribución de ruido
El ruido se extrae de la distribución de Laplace con los siguientes parámetros:
- Una media (
μ
) de 0 Esto significa que el valor de ruido más probable es 0 (sin ruido agregado) y que es probable que el valor de ruido sea menor que el original como mayor (esto a veces se denomina imparcial). - Un parámetro de escala de
b = CONTRIBUTION_BUDGET
/epsilon
.CONTRIBUTION_BUDGET
se define en el navegador.epsilon
se corrige en el servidor de agregación.
El siguiente diagrama muestra la función de densidad de probabilidad para una distribución de Laplace con μ=0, b = 20:
Valores de ruido aleatorios, una distribución de ruido
Supongamos que una tecnología publicitaria solicita informes de resumen para dos claves de agregación, key1 y key2.
El servicio de agregación selecciona dos valores de ruido x1 y x2, siguiendo la misma distribución de ruido. x1 se agrega al valor de resumen de la clave1 y x2 al valor de resumen de la clave2.
En los diagramas, representaremos los valores de ruido como idénticos. Esto es una simplificación; en realidad, los valores de ruido variarán, ya que se extraen de manera aleatoria de la distribución.
Esto ilustra que todos los valores de ruido provienen de la misma distribución y son independientes del valor de resumen al que se aplican.
Otras propiedades del ruido
El ruido se aplica a cada valor de resumen, incluidos los vacíos (0).
Por ejemplo, incluso si el verdadero valor del resumen de una clave determinada es 0, el valor del resumen ruidoso que verás en el informe de resumen de esta clave no será (lo más probable) que sea 0.
El ruido puede ser un número positivo o negativo.
Por ejemplo, para un importe de compra previo al ruido de 327,000, el ruido puede ser +6,000 o -6,000 (estos son valores de ejemplo arbitrarios).
Evaluación del ruido
Calcula la desviación estándar del ruido
La desviación estándar del ruido es la siguiente:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Ejemplo
Con épsilon = 10, la desviación estándar del ruido es:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Cómo evaluar cuándo las diferencias en las mediciones son significativas
Debido a que conocerás la desviación estándar del ruido que el servicio de agregación agrega a cada valor de salida, puedes determinar los umbrales adecuados para realizar una comparación y determinar si las diferencias observadas podrían deberse al ruido.
Por ejemplo, si el ruido que se agrega a un valor es de aproximadamente +/- 10 (considerando el escalamiento) y la diferencia en el valor entre dos campañas es superior a 100, es probable que sea seguro concluir que la diferencia en el valor medido entre cada campaña no se debe solo al ruido.
Interactúa y comparte comentarios
Puedes participar y experimentar con esta API.
- Lee sobre los informes agregables y el servicio de agregación, haz preguntas y sugiere comentarios.
- Consulta las Guías de Informes de atribución.
- Haz preguntas y únete a los debates en el repositorio de asistencia para desarrolladores de Privacy Sandbox.
Próximos pasos
- Si quieres saber qué variables puedes controlar para mejorar la relación señal/ruido, consulta el artículo Cómo trabajar con ruido.
- Revisa los experimentos con decisiones de diseño de informes de resumen para obtener ayuda con la planificación de tus estrategias de informes de agregación.
- Prueba el Lab de ruido.