Framework de teste de carga do serviço de agregação

Seu feedback sobre este documento é bem-vindo à medida que nos preparamos para adicioná-lo ao nosso repositório público de orientações.

Recomendamos que as adtechs façam testes de carga em 100% do tráfego de produção:

  1. As adtechs precisam acessar a medição de atribuição de conversão usando a API Attribution Reporting como casos de uso de relatórios.
  2. A adtech precisa tomar decisões de design minimizando o ruído (referência: decisões de design estimadas).
  3. Durante os testes, as adtechs precisam acompanhar o número de jobs executados por dia (por exemplo, jobs por anunciante), uma distribuição estimada do volume de eventos de conversão e o número de chaves agregadas como entrada por job de processamento (consulte o parâmetro de job "output_domain_blob_prefix" na documentação da API Agregação Service) e a média estimada de eventos de conversão por relatório de entrada.
  4. Para testes, as adtechs precisam procurar o tipo de instância recomendado na tabela de orientação de dimensionamento com base no tamanho esperado do job (ou seja, volume de relatório, tamanho do domínio) e o tamanho adequado do serviço de agregação implantado. Referência: Orientações de dimensionamento para serviços agregados na AWS
  5. As adtechs precisam executar jobs de agregação para testes de carga.

Objetivos

Essa orientação é específica para a medição agregada de atribuição de conversões e vai incluir as principais instruções de configuração destinadas ao uso por adtech para:

  • Estime as expectativas de carga para a medição agregada de atribuição de conversões.
  • Otimizar a configuração principal para desempenho e ruído com base nas dimensões e metas que pretendem medir, além do tamanho e da segmentação dos anunciantes.

Pré-requisitos

Este guia é destinado ao público de adtechs. Antes de passar para as etapas a seguir, consulte nossa documentação sobre como trabalhar com ruído, decisões de design de relatórios resumidos e teste o laboratório de ruído para uma configuração ideal.

Passos

1. Estratégia inicial de configuração da chave de agregação

Determine quantas estruturas principais diferentes (ou seja, conjunto de dimensões) você precisa com base no seu tipo de negócio e nos seus objetivos. Otimizar a estrutura da chave pode ajudar a reduzir o ruído nos relatórios.

O número de anunciantes que você tem
Por exemplo, digamos que você tenha 1.000 anunciantes.

As semelhanças entre os anunciantes
As semelhanças precisam ser avaliadas com base no volume de conversões, nos valores de conversão relativos e na cobertura geral das características do anunciante. Quanto mais semelhantes você conseguir agrupá-los, mais ajustados serão seus resultados (devido à menor variação nos valores de saída) e, portanto, menor o impacto do ruído. Consulte o gerenciamento avançado de chaves para saber mais. Por exemplo, uma adtech pode segmentar os anunciantes por setor, gasto e volume de conversão da seguinte maneira:

  • Setor (por exemplo: seguros, joias, crescimento de varejo)
  • Gasto (por exemplo: <US$ 50.000/trimestre, US$ 50 a US$ 150.000/trimestre, US$ 150.000 a US$ 250.000/trimestre)
  • Volume de conversão (baixo, médio, alto)

O número de estruturas de chaves agregadas a serem criadas
Por exemplo, 27 (3 x 3 x 3) : três setores, três tipos de gastos e três agrupamentos para valores de conversão.

2. Identificar dimensões da chave de agregação

Em seguida, identifique as dimensões importantes que você quer acompanhar para impressões e conversões para estimar o número de chaves do lado da origem e do acionador.

Para cada estrutura de chave de agregação, as dimensões importantes que você precisa acompanhar para impressões ajudarão a determinar o número de chaves secundárias. As dimensões dependerão do tipo de anunciante do 1o item acima (ou seja, setor, gasto, conversão). Os exemplos a seguir ajudam a explicar as dimensões:

  • Estrutura principal 1: (setor = seguros, gasto = <50.000, volume de conversão = baixo)

    • R: Quatro dimensões: campanha (por exemplo, 50 possibilidades), grupo de anúncios (por exemplo, 20 possibilidades), tipo de dispositivo (por exemplo: 5 possibilidades), Geo (por exemplo: 50 possibilidades)
      1. Combinações dimensionais possíveis = 50 x 20 x 5 x 50 = 250.000. Isso representa o número de combinações dimensionais possíveis para as chaves do lado da origem da estrutura chave 1.
      2. Precisa reservar 18 bits (18 bits = 262.144 combinações possíveis)
  • Estrutura principal 2: (setor = seguros, gasto = <50.000, volume de conversão = médio)

    • R: Quatro dimensões: campanha (por exemplo, 30 possibilidades), grupo de anúncios (por exemplo, 80 possibilidades), tipo de anúncio (por exemplo: 3 possibilidades), Geográfica (por exemplo, 50 possibilidades).
      1. Combinações dimensionais possíveis = 30 x 80 x 3 x 50 = 360.000. Isso representa o número de combinações dimensionais possíveis ou chaves do lado da origem para a estrutura chave 2.
      2. Precisa reservar 19 bits (19 bits) = 524.288 combinações possíveis
  • Estrutura principal 3: repita (do mesmo modo para todas as estruturas principais)

Para cada estrutura de chave de agregação, as dimensões importantes que você precisa acompanhar para conversões ajudam a determinar as chaves secundárias do acionador. Exemplo:

  • Estrutura principal 1: (setor = seguros, gasto = <50.000, volume de conversão = baixo)

    • A: 2 dimensões: categoria do produto (por exemplo, 100 possibilidades), tipo de conversão (por exemplo, cinco possibilidades)
      1. Possíveis combinações dimensionais = 100 x 5 = 500
      2. Precisa reservar 9 bits (9 bits = 512 combinações possíveis)
  • Estrutura principal 2: (setor = seguros, gasto = <50.000, volume de conversão = médio)

    • A: 3 dimensões: categoria do produto (por exemplo, 50 possibilidades), tipo de produto (10 possibilidades), tipo de conversão (3 possibilidades)
      1. Possíveis combinações dimensionais = 50 x 10 x 3 = 1.500
      2. Precisa reservar 11 bits (11 bits = 2.048 combinações possíveis)
  • Estrutura principal 3: repita (do mesmo modo para todas as estruturas principais)

Estimativas para chaves de agregação

  • Estrutura de chaves 1: 250.000 chaves de impressão x 500 chaves de conversão = 125.000.000 chaves
  • Estrutura de chaves 2: 360.000 chaves de impressão x 1,5 mil chaves de conversão = 540.000.000 chaves
  • Estrutura principal 3: (do mesmo modo para todas as estruturas principais que você tem)
  • Repetir esse processo para cada estrutura de teclas
  • Máximo de chaves agregadas = 540.000.000 chaves (em todas as estruturas de chaves). Precisa reservar 30 bits (30 bits = 1,07 bilhões de combinações possíveis)

Volume de conversão estimado

Para cada estrutura de chave de agregação, é possível explicar o volume previsto usando os exemplos a seguir:

  • Estrutura principal 1: (setor = seguros, gasto = <50.000, volume de conversão = baixo)
    • R: Preveja que a estrutura-chave 1 constituirá cerca de US $500 mil em gastos de anunciantes no próximo trimestre,a uma média de CPM de US $8. Isso vai resultar em 62.500.000 impressões que precisam ser registradas.
    • Antecipe que a taxa média de impressões para conversão que a Estrutura de chave 1 vai ter no próximo trimestre é de 0,08%, resultando em 50.000 conversões atribuídas que precisam ser capturadas. Para cada conversão, meça o valor e a contagem de compras.
  • Estrutura principal 2: (setor = seguros, gasto = <50.000, volume de conversões = médio)
    • R: Preveja que a Chave 2 constituirá cerca de US$ 800 mil em gastos no próximo trimestre para uma média de CPM de US$ 10. Isso pode resultar em 80 milhões de impressões que precisam ser registradas.
    • Antecipe que a taxa média de impressões para conversão que a Chave 2 vai constituir no próximo trimestre é de 0,03125%, resultando em 25.000 conversões atribuídas que precisam ser capturadas. Para cada conversão, meça o valor e a contagem de compras.
  • Repetir esse processo para cada estrutura de teclas

Exibição de relatórios e frequência de lotes (lote por anunciante)**

Para cada estrutura de chave de agregação, você vai precisar de relatórios de conversão enviados de forma recorrente. Recomendamos que as adtechs agrupem por anunciante (para uma separação mais clara dos dados por relatório e uma agregação mais eficiente) e usem o campo shared_info.scheduled_report_time do relatório para lotes.

  • A: Por hora
  • B: diária
  • C: Semanal

Observações

  • Para lotes por anunciante, verifique os SLAs com os anunciantes.
  • Lotes mais frequentes vão incluir mais ruído por lote. Consulte Decisão: frequência de lote.

  • Para evitar erros devido a lotes incorretos, eles precisam usar o campo scheduled_report_time, não report arrival time. Por exemplo: se você processar lotes a cada hora, o lote das 11h precisará incluir apenas relatórios com scheduled_report_time entre 10h e 11h, e não relatórios que chegaram entre 10h e 11h com um scheduled_report_time diferente (por exemplo: 9h).

Estimativas para o volume de relatórios

  • Estrutura principal 1: 50.000 conversões atribuídas / 2.160 (relatórios por hora, horas em um trimestre) = 24 relatórios de resumo por hora por anunciante (24 x 1.000 anunciantes = 24 mil relatórios de resumo)
  • Estrutura principal 2: 25.000 conversões atribuídas / 2.160 (relatórios por hora, horas em um trimestre) = 12 relatórios de resumo por hora e por anunciante (12 x 1.000 anunciantes = 12 mil relatórios de resumo)
  • Estrutura principal 3: repetir
  • Número total de relatórios de resumo por hora = 24 relatórios de resumo para a estrutura chave 1 + 12 relatórios de resumo para a estrutura principal 2 + ... = ... por hora por anunciante

Resumo do feedback

Entender as estimativas abaixo das adtechs nos ajuda a planejar recursos e melhorias para oferecer suporte à escala exigida pelas adtechs. Sugerimos que você compartilhe o seguinte conosco. Consulte nossas orientações de dimensionamento para o serviço de agregação na AWS para mais informações:

  • Máximo de chaves de domínio de entrada (chaves a serem agregadas) por job de serviço de agregação
  • Volume máximo de relatórios de entrada por job (conversões atribuídas)
  • Contribuições estimadas por relatório (pares de chave/valor em um relatório)
  • Distribuição estimada de conversões atribuídas por job
  • Distribuição estimada de chaves de domínio em um job
  • Número estimado de jobs por hora/dia/semana