Clasificación de temas

Lee cómo se infieren los temas y cómo se asignan a las carpetas de los usuarios navegadores y cómo los usuarios pueden controlar su lista de temas.

Estado de implementación

¿Qué es un tema?

En la API de Topics, un tema es aquel que le interesa a un usuario, tal como lo demuestran los sitios web que visita.

Los temas son un indicador que ayuda a las plataformas de tecnología publicitaria a seleccionar anuncios relevantes. A diferencia de las cookies de terceros, esta información se comparte sin revelar información adicional sobre el usuario ni su actividad de navegación.

La API de Topics permite que terceros, como plataformas de tecnología publicitaria, observen temas de interés para un usuario y, luego, accedan a ellos. Por ejemplo, la API podría sugerir el tema "Fiber & Artes textiles" para un usuario que visita el sitio web knitting.example.

La lista de temas que usa la API de Topics es pública, seleccionada por humanos, legible por humanos y está diseñada para evitar categorías sensibles. Esta es la lista actual, que se expandirá con el tiempo. La lista está estructurada como una taxonomía. Los temas pueden ser generales o más específicos. Por ejemplo, Food & Drink es una categoría amplia, con la subcategoría Cooking & Recipes. Las subcategorías se pueden dividir en subcategorías adicionales.

Esta taxonomía de temas debe equilibrar la utilidad y la privacidad. Si los temas son demasiado específicos, se podrían utilizar para identificar a un usuario individual. Si son demasiado generales, no son útiles para seleccionar contenido publicitario ni otro tipo de contenido.

La taxonomía de temas se construye con dos requisitos subyacentes en mente:

  • Cómo admitir la publicidad basada en intereses
  • Mantén seguros a los usuarios y protege su privacidad

Esto sugiere varias preguntas. Por ejemplo:

  • ¿Cuál es la mejor manera de que la API infiera temas de interés para un usuario, según su actividad de navegación, mientras preserva la privacidad del usuario?
  • ¿Cómo se podría estructurar la taxonomía para que sea más útil?
  • ¿Qué elementos específicos debería incluir la taxonomía?

Cómo infiere la API los temas de un sitio

Los temas derivan de un modelo clasificador que asigna los nombres de host de los sitios web a cero o más temas. Analizar información adicional (como las URLs completas o el contenido de las páginas) podría permitir mostrar anuncios más relevantes, pero también podría reducir la privacidad.

El modelo clasificador para asignar nombres de host a temas está disponible públicamente y, como en las notas de explicación, es posible ver los temas de un sitio a través de las herramientas para desarrolladores del navegador. Se espera que el modelo evolucione y mejore con el tiempo, y que se actualice periódicamente. todavía se está considerando su frecuencia.

Solo los sitios que incluyen código que llama a la API de Topics se incluyen en el historial de navegación aptos para cálculos de frecuencia de temas, y los llamadores de API solo reciben los temas que observaron. En otras palabras, los sitios no son aptos para los cálculos de frecuencia de temas sin que el sitio o un servicio incorporado llame a la API.

Además, el emisor solo puede recibir temas que su código haya "visto". Por lo tanto, si el código de otro llamador registró un tema, por ejemplo, /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, para el navegador de un usuario y tu código no hizo que se registrara ese tema en el navegador de ese usuario, no podrás obtener información sobre ese tema de interés para ese navegador cuando llames a la API desde tu código incorporado. Ten en cuenta que, como la API ahora incluye principales como se observaron, en el ejemplo anterior, /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, también se observarían Autos & Vehicles y Motor Vehicles.

Los temas que se muestran para un usuario se vuelven a calcular para un llamador, según el sitio de nivel superior. Por ejemplo, si adtech.example solicita los temas del usuario el news-a.example, luego el news-b.example y, luego, el news-c.example, los temas que se les muestren se volverán a calcular en cada sitio. Esto significa que es probable que un llamador obtenga diferentes temas para un usuario en diferentes sitios de nivel superior, ya que los tres temas (máximo) que se muestran para un usuario se eligen al azar entre los cinco principales durante los últimos tres ciclos de entrenamiento (con un 5% de probabilidades de obtener un tema aleatorio). Esto hace que sea más difícil para un llamador identificar a un usuario por sus temas, ya que es probable que sean diferentes en los diferentes sitios de nivel superior (incluso para el mismo usuario, llamador y época).

El modelo clasificador

Los temas se seleccionan manualmente para 50,000 dominios principales y se usan para entrenar el clasificador. Esta lista se encuentra en override_list.pb.gz, que está disponible en chrome://topics-internals/ en el modelo actual en la pestaña Clasificador. La API usa las asociaciones dominio a temas de la lista en lugar de la salida del modelo.

Página chrome://topics-internals con el panel Clasificador seleccionado
El panel Clasificador de la página chrome://topics-internals enumera la versión del modelo, su ruta de acceso y los temas asociados con cada host de la lista.

Para ejecutar el modelo directamente, consulta la guía de TensorFlow para ejecutar un modelo.

Para inspeccionar el archivo override_list.pb.gz, primero descomprímelo:

gunzip -c override_list.pb.gz > override_list.pb

Usa protoc para inspeccionarlo como texto:

protoc --decode_raw < override_list.pb > output.txt

En GitHub, hay una taxonomía completa de temas con IDs disponible.

Proporcionar comentarios o entradas sobre el modelo de clasificación

Hay varios canales para proporcionar comentarios sobre la API de Topics. Para obtener comentarios sobre el modelo de clasificación, recomendamos enviar un problema de GitHub o responder a uno existente. Por ejemplo:

Cómo se seleccionan los cinco temas principales del usuario

La API muestra un tema para cada época, hasta un máximo de tres. Si se muestran tres, se incluyen temas para el ciclo de entrenamiento actual y los dos anteriores.

  1. Al final de cada ciclo de entrenamiento, el navegador compila una lista de páginas que cumplen con los siguientes criterios:
    • El usuario visitó la página durante la época.
    • La página incluye un código que llama a document.browsingTopics().
    • Se habilitó la API (por ejemplo, no la bloqueó el usuario ni un encabezado de respuesta).
  2. El navegador, en el dispositivo del usuario, usa el modelo clasificador que proporciona la API de Topics para asignar el nombre de host de cada página a una lista de temas.
  3. El navegador acumula la lista de temas.
  4. El navegador genera una lista de los cinco temas principales por frecuencia.

Luego, el método document.browsingTopics() muestra un tema aleatorio de los cinco principales para cada época, con un 5% de probabilidades de que cualquiera de estos se pueda elegir de forma aleatoria de la taxonomía completa de temas. En Chrome, los usuarios también pueden quitar temas individuales o borrar su historial de navegación para reducir la cantidad de temas que muestra la API. Los usuarios también pueden inhabilitar la API.

Puedes ver información sobre los temas observados durante la época actual en la página chrome://topics-internals.

Cómo decide la API qué emisores ven qué temas

Los llamadores de API solo reciben temas que han observado recientemente, y los temas de un usuario se actualizan una vez por cada época. Esto significa que la API proporciona un período de implementación en el que un llamador determinado puede recibir ciertos temas.

En la siguiente tabla, se describe un ejemplo (aunque poco realista) de un historial de navegación hipotético para un usuario durante un solo ciclo de entrenamiento. Se muestran temas asociados con los sitios que visitó y los llamadores de la API presentes en cada sitio (las entidades que llaman a document.browsingTopics() en el código JavaScript que se incluyen en el sitio).

Sitio Temas Emisores de API en el sitio
yoga.example Fitness adtech1.example adtech2.example
knitting.example Manualidades adtech1.example
vacaciones-de-caminata.example Entrenamiento físico, viajes y Transporte adtech2.example
diy-clothing.example Manualidades, moda y Estilo [ninguno]

Al final del ciclo de entrenamiento (actualmente una semana), la API de Topics genera los temas principales del navegador para la semana.

  • adtech1.example ahora es apto para recibir la categoría "Entrenamiento" y "Manualidades" ya que los observó en yoga.example y knitting.example.
  • adtech1.example no es apto para recibir la columna "Viajes y Transporte" para este usuario, ya que no está presente en ningún sitio que visitó recientemente y que esté asociado con ese tema.
  • adtech2.example vio los registros de y "Viajes y Transporte" temas, pero no vio el libro "Manualidades" en el tema.

El usuario visitó diy-clothing.example, que tiene el valor "Fashion & Estilo" pero no hubo llamadas a la API de Topics en ese sitio. En este punto, esto significa que las campañas de “Moda y Estilo" tema no se mostrará en la API a ningún llamador.

En la segunda semana, el usuario visita otro sitio:

Sitio Temas Emisores de API en el sitio
sewing.example Manualidades adtech2.example

Además, se agregó el código de adtech2.example a diy-clothing.example:

Sitio Temas Emisores de API en el sitio
diy-clothing.example Manualidades, moda y Estilo adtech2.example

Además de "Ejercicio" y "Viajes y Transporte" a partir de la semana 1, esto significa que adtech2.example ahora podrá recibir el y “Moda y Estilo" pero no hasta la siguiente época, la semana 3. Esto garantiza que los terceros no puedan obtener más información sobre el pasado de un usuario (en este caso, un interés en la moda) que con las cookies.

Después de otras dos semanas, y "Viajes y Transporte" Es posible que se retiren de la lista de temas aptos de adtech2.example si el usuario no visita ningún sitio con esos temas que incluyan el código de adtech2.example.

Controles del usuario, transparencia e inhabilitación

Los usuarios deben poder comprender el propósito de la API de Topics, reconocer lo que se dice sobre ellos, saber cuándo la API está en uso y contar con controles para habilitarla o inhabilitarla.

La taxonomía legible de la API permite a los usuarios conocer y controlar los temas que su navegador podría sugerir. Los usuarios pueden quitar temas que específicamente no desean que la API de Topics comparta con anunciantes o publicadores, y puede haber controles para informarles sobre la API y mostrar cómo habilitarla o inhabilitarla. Chrome proporciona información y configuración para la API de Topics en chrome://settings/adPrivacy. Además, los temas no están disponibles para los llamadores de la API en el modo Incógnito y se borran cuando se borra el historial de navegación.

La lista de temas que se muestra estará vacía en los siguientes casos:

  • El usuario inhabilita la API de Topics a través de la configuración del navegador en chrome://settings/adPrivacy.
  • El usuario borró sus temas (en la configuración del navegador en chrome://settings/adPrivacy) o sus cookies.
  • El navegador está en modo Incógnito.

La explicación proporciona más detalles sobre los objetivos de privacidad y cómo la API busca cumplirlos.

Inhabilitación de sitios

Además de la capacidad del usuario de inhabilitar la función, puedes inhabilitar Topics en tu sitio o las páginas. En la guía para desarrolladores se explica cómo hacerlo.

Cómo usar la API de Topics en sitios web con prebid.js

Como se mencionó en el lanzamiento de Prebid 7, la comunidad desarrolló activamente una integración con la API de Topics a través de un nuevo módulo. Este módulo se combinó en diciembre de 2022.

Obtenga más información aquí:

Próximos pasos

Interactúa y comparte comentarios