Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
.
Buscando arquivos
O processo de ingestão do DTv2 é semelhante ao do DTv1, mas você precisa de algumas coisas importantes
durante a migração.
Processando arquivos
O DTv2 processa arquivos por hora (impressão, clique e rich media) e arquivos diários (atividades e tabelas de correspondências).
Os arquivos por hora (o nome do arquivo contém AAAAMMDDHH) são processados no fuso horário UTC. Arquivos diários (o nome do arquivo contém AAAAMMDD) são processados no horário local do relatório
zona veja o formato do nome do arquivo. A diferença entre o horário local e o UTC varia de acordo com sua localização.
Os arquivos também são processados de forma independente, e o tempo de processamento pode variar. É comum
hora 6 antes da hora 5 para terminar o processamento antes de um arquivo anterior (por exemplo, hora 6 antes da hora 5).
Não dependa da ordem dos arquivos para seu processo de processamento, caso contrário, seu processo pode ser interrompido.
Os eventos podem aparecer em arquivos processados anteriores ou posteriores em relação ao horário deles.
Os eventos nem sempre são processados na hora em que ocorreram.
Ordem das colunas
Não dependa da ordem das colunas como um mecanismo para consumir seus arquivos.
Queremos que seu processamento seja resiliente a mudanças. se você solicitar colunas extras
ou se fizermos alterações no futuro, a ordem e o número de colunas em seus relatórios poderão ser alterados.
Leia a linha de cabeçalho de cada arquivo e mapeie-a para os campos do data warehouse antes de tentar
gravar os dados.
Arquivos duplicados
Às vezes, arquivos duplicados são gravados para a mesma data e hora. Se mais de um arquivo tiver o
mesmo carimbo de data/hora, use aquele com os últimos minutos / segundos, com base no nome do arquivo
carimbo de data/hora. Arquivos duplicados são criados porque os processos de back-end determinaram que houve um problema
com o arquivo original.
Campos
Os nomes dos campos e o formato deles foram alterados, mas há um mapeamento do antigo para o novo
(quando disponível) na migração de campos do DCM, incluindo as tabelas de correspondências.
Se você não for um usuário do DBM, esses campos ficarão vazios e você poderá ignorar o campo.
Também é possível ver campos do DBM no seu arquivo. Se você for um usuário do DBM, esses campos serão preenchidos apenas
quando a permissão relevante é concedida no nível do anunciante do DBM em que os anunciantes estão vinculados.
Há um mapeamento do antigo para o novo (quando disponível) em Migração de campos do DBM. Arquivos de leitura de entidades do DBM
será usada para fins de mapeamento.
Nomes de bucket
Os padrões de nomenclatura para DTv1 e DTv2 são diferentes; especificamente, não é possível alterar o prefixo em
o nome do bucket atual para definir o nome do bucket DTv2. O nome do bucket será fornecido
com o representante de suporte quando sua conta for configurada.
Geralmente, os nomes dos buckets DTv2 são semelhantes a gs://dcdt_-dcm_account1234.
Cada nome de arquivo terá uma string de números, por exemplo: dcm_account1234_impression_2016022601_20160225_234912_218211994.csv.gz 2016022601 está no formato AAAAMMDDHH. Esta é a hora UTC para eventos
(as horas são numeradas de 0 a 23). 20160225_234912 está no formato AAAAMMDD_HHMMSS. Esse é o momento em que o relatório foi
gerada. 218211994 é o ID do arquivo.
Arquivos de atividades
Você recebe um arquivo de atividade por dia. O nome do arquivo é este: dcm_account1234_activity_20160727_20160728_035750_268669761.csv.gz
Este arquivo contém dados de 27 de julho de 2016 e foi gerado às 3:57:50 de 28 de julho de 2016.
Clique em "Arquivos"
Você recebe 24 arquivos de clique por dia, com o seguinte nome: dcm_account1234_click_2016072717_20160728_012331_268381796.csv.gz
Anote a hora UTC após a string de data no nome do arquivo. as horas são numeradas de 0 a 23, então
um 17 aqui indica que os eventos neste arquivo são para 17:00 a 17:59 (no formato 24 horas) ou 17:00 às 18:00.
Este arquivo contém dados de 17h a 18h de 27 de julho de 2016 e foi gerado às 13h23:31 de
28 de julho de 2016.
Arquivos de impressão
Você recebe 24 arquivos de impressão por dia, e o nome do arquivo tem esta aparência: dcm_account7312_impression_2016072717_20160728_012355_268381795.csv.gz
Além do nome do arquivo, ele se comporta da mesma forma que arquivos de clique.
Arquivos da tabela de correspondências
Os arquivos da Tabela de correspondências são gerados uma vez por dia, e os nomes dos arquivos têm a seguinte aparência: dcm_account1234_match_table_activity_cats_20160727_20160728_032226_268648829.csv.gz
Este arquivo contém dados de 27 de julho de 2016 e foi gerado às 3:22:26 de 28 de julho de 2016.
Observação: para algumas tabelas de correspondências novas, os dados são estáticos e nenhum arquivo diário é gerado para download. você
é possível obter os dados desses arquivos nas páginas de referência, por exemplo,
Tipos de evento padrão de rich media.
Campos da Transferência de dados
Nome do campo 1.0
Nome do campo do DT v2.0
Tempo
Descontinuado
User-ID
User-ID
ID do anunciante
ID do anunciante
ID de compra
Descontinuado
ID do pedido
ID da campanha
ID do anúncio
ID do anúncio
ID do criativo
ID de renderização
Versão do criativo
Versão do anúncio
Creative-Size-ID
Descontinuado (recuperado da tabela de correspondências como tamanho de pixels do criativo)
ID do site
Código do site (DCM)
ID da página
ID da posição
Palavra-chave
Descontinuado
ID do país
Código do país
Estado/Província
Estado/região
Código de área
Descontinuado
ID do navegador
Código da plataforma/navegador
Browser-Version
Versão de navegador/plataforma
ID do SO
Código do sistema operacional
DMA-ID
Código da área de mercado designada (AMD)
ID da cidade
ID da cidade
CEP
CEP
Tempo-UTC-s
Suspenso
User-ID local
Descontinuado
Tipo de atividade
Descontinuado (extraído da tabela de correspondências "activity_cats")
Subtipo de atividade
Descontinuado (extraído da tabela de correspondências "activity_cats")