Migração do DT v1.0

.

Buscando arquivos

O processo de ingestão do DTv2 é semelhante ao do DTv1, mas você precisa de algumas coisas importantes durante a migração.

Processando arquivos

O DTv2 processa arquivos por hora (impressão, clique e rich media) e arquivos diários (atividades e tabelas de correspondências). Os arquivos por hora (o nome do arquivo contém AAAAMMDDHH) são processados no fuso horário UTC. Arquivos diários (o nome do arquivo contém AAAAMMDD) são processados no horário local do relatório zona veja o formato do nome do arquivo. A diferença entre o horário local e o UTC varia de acordo com sua localização.

Os arquivos também são processados de forma independente, e o tempo de processamento pode variar. É comum hora 6 antes da hora 5 para terminar o processamento antes de um arquivo anterior (por exemplo, hora 6 antes da hora 5). Não dependa da ordem dos arquivos para seu processo de processamento, caso contrário, seu processo pode ser interrompido.

Os eventos podem aparecer em arquivos processados anteriores ou posteriores em relação ao horário deles. Os eventos nem sempre são processados na hora em que ocorreram.

Ordem das colunas

Não dependa da ordem das colunas como um mecanismo para consumir seus arquivos. Queremos que seu processamento seja resiliente a mudanças. se você solicitar colunas extras ou se fizermos alterações no futuro, a ordem e o número de colunas em seus relatórios poderão ser alterados. Leia a linha de cabeçalho de cada arquivo e mapeie-a para os campos do data warehouse antes de tentar gravar os dados.

Arquivos duplicados

Às vezes, arquivos duplicados são gravados para a mesma data e hora. Se mais de um arquivo tiver o mesmo carimbo de data/hora, use aquele com os últimos minutos / segundos, com base no nome do arquivo carimbo de data/hora. Arquivos duplicados são criados porque os processos de back-end determinaram que houve um problema com o arquivo original.

Campos

Os nomes dos campos e o formato deles foram alterados, mas há um mapeamento do antigo para o novo (quando disponível) na migração de campos do DCM, incluindo as tabelas de correspondências. Se você não for um usuário do DBM, esses campos ficarão vazios e você poderá ignorar o campo.

Também é possível ver campos do DBM no seu arquivo. Se você for um usuário do DBM, esses campos serão preenchidos apenas quando a permissão relevante é concedida no nível do anunciante do DBM em que os anunciantes estão vinculados. Há um mapeamento do antigo para o novo (quando disponível) em Migração de campos do DBM. Arquivos de leitura de entidades do DBM será usada para fins de mapeamento.

Nomes de bucket

Os padrões de nomenclatura para DTv1 e DTv2 são diferentes; especificamente, não é possível alterar o prefixo em o nome do bucket atual para definir o nome do bucket DTv2. O nome do bucket será fornecido com o representante de suporte quando sua conta for configurada.

Geralmente, os nomes dos buckets DTv2 são semelhantes a gs://dcdt_-dcm_account1234.

Para acessar o conteúdo do bucket em um navegador, https://cloud.google.com/console#/storage/browser/dcdt_-dcm_account1234

Formato do nome do arquivo

Cada nome de arquivo terá uma string de números, por exemplo:
dcm_account1234_impression_2016022601_20160225_234912_218211994.csv.gz
2016022601 está no formato AAAAMMDDHH. Esta é a hora UTC para eventos (as horas são numeradas de 0 a 23).
20160225_234912 está no formato AAAAMMDD_HHMMSS. Esse é o momento em que o relatório foi gerada.
218211994 é o ID do arquivo.

Arquivos de atividades

Você recebe um arquivo de atividade por dia. O nome do arquivo é este:
dcm_account1234_activity_20160727_20160728_035750_268669761.csv.gz
Este arquivo contém dados de 27 de julho de 2016 e foi gerado às 3:57:50 de 28 de julho de 2016.

Clique em "Arquivos"

Você recebe 24 arquivos de clique por dia, com o seguinte nome:
dcm_account1234_click_2016072717_20160728_012331_268381796.csv.gz
Anote a hora UTC após a string de data no nome do arquivo. as horas são numeradas de 0 a 23, então um 17 aqui indica que os eventos neste arquivo são para 17:00 a 17:59 (no formato 24 horas) ou 17:00 às 18:00.
Este arquivo contém dados de 17h a 18h de 27 de julho de 2016 e foi gerado às 13h23:31 de 28 de julho de 2016.

Arquivos de impressão

Você recebe 24 arquivos de impressão por dia, e o nome do arquivo tem esta aparência:
dcm_account7312_impression_2016072717_20160728_012355_268381795.csv.gz
Além do nome do arquivo, ele se comporta da mesma forma que arquivos de clique.

Arquivos da tabela de correspondências

Os arquivos da Tabela de correspondências são gerados uma vez por dia, e os nomes dos arquivos têm a seguinte aparência:
dcm_account1234_match_table_activity_cats_20160727_20160728_032226_268648829.csv.gz
Este arquivo contém dados de 27 de julho de 2016 e foi gerado às 3:22:26 de 28 de julho de 2016.
Observação: para algumas tabelas de correspondências novas, os dados são estáticos e nenhum arquivo diário é gerado para download. você é possível obter os dados desses arquivos nas páginas de referência, por exemplo, Tipos de evento padrão de rich media.

Campos da Transferência de dados

Nome do campo 1.0 Nome do campo do DT v2.0
Tempo Descontinuado
User-ID User-ID
ID do anunciante ID do anunciante
ID de compra Descontinuado
ID do pedido ID da campanha
ID do anúncio ID do anúncio
ID do criativo ID de renderização
Versão do criativo Versão do anúncio
Creative-Size-ID Descontinuado (recuperado da tabela de correspondências como tamanho de pixels do criativo)
ID do site Código do site (DCM)
ID da página ID da posição
Palavra-chave Descontinuado
ID do país Código do país
Estado/Província Estado/região
Código de área Descontinuado
ID do navegador Código da plataforma/navegador
Browser-Version Versão de navegador/plataforma
ID do SO Código do sistema operacional
DMA-ID Código da área de mercado designada (AMD)
ID da cidade ID da cidade
CEP CEP
Tempo-UTC-s Suspenso
User-ID local Descontinuado
Tipo de atividade Descontinuado (extraído da tabela de correspondências "activity_cats")
Subtipo de atividade Descontinuado (extraído da tabela de correspondências "activity_cats")
Outros dados Outros dados
Ordinal Valor ORD
Tempo de clique Tempo de interação
ID do evento ID de conversão
SV1 Valor de segmento 1
PartnerID1 ID do parceiro 1
PartnerID2 ID do parceiro 2
Quantidade Conversões totais
Receita Receita total

Nomes de arquivo da tabela de correspondências

Nome do arquivo 1.0 Nome do arquivo 2.0
activity_cat activity_cats
activity_type activity_types
ad ads
ad_page_assignments ad_placement_assignments
advertiser advertisers
browser browsers
campaign campaigns
cities cities
countries countries
creative creatives
creative_ad_assignments creative_ad_assignments
custom_creative_fields custom_creative_fields
dartsearch paid_search
designated_market_area designated_market_areas
keyval keyword_values
met_event rich_media_events
operating_system operating_systems
page placements
page_cost/page_flight_cost placement_cost
site sites
states states
user-defined_spot_vars custom_floodlight_variables

Campos da tabela de correspondências

activity_cats

Nome do campo 1.0 Nome do campo 2.0 Tipo
Spot-ID Floodlight Configuration número inteiro
Activity-Type-ID Activity Group ID número inteiro
Activity-Type Activity Type string
Activity-ID Activity ID integer
Activity Sub-Type Activity Sub-Type string
Report-Name Activity string
Tag-Method-ID Tag Counting Method ID número inteiro

activity_types

Nome do campo 1.0 Nome do campo 2.0 Tipo
Spot-ID Floodlight Configuration número inteiro
Activity-Group-ID Activity Group ID número inteiro
Activity-Type Activity Type string
Report-Name Activity Group string

anúncios

Nome do campo 1.0 Nome do campo 2.0 Tipo
Advertiser-ID Advertiser ID número inteiro
Buy-ID Campaign ID número inteiro
Ad-ID Ad ID número inteiro
Ad-Description Ad string
Click-URL Ad Click URL string
Ad-Type Ad Type string
Creative-Size-ID Creative Pixel Size string
Ad-Comments Ad Comments string

ad_placement_assignments

Nome do campo 1.0 Nome do campo 2.0 Tipo
Ad-ID Ad ID número inteiro
Page-ID Placement ID número inteiro

anunciantes

Nome do campo 1.0 Nome do campo 2.0 Tipo
Spot-ID Floodlight Configuration número inteiro
Advertiser-ID Advertiser ID número inteiro
Advertiser Advertiser string
Advertiser-Group-ID Advertiser Group ID integer
Advertiser-Group Advertiser Group string

navegadores

Nome do campo 1.0 Nome do campo 2.0 Tipo
Browser-ID Browser/Platform ID número inteiro
Browser Browswer/Platform string

de campanhas

Nome do campo 1.0 Nome do campo 2.0 Tipo
Advertiser-ID Advertiser ID número inteiro

Order-ID (anteriormente Buy-ID )

Campaign ID número inteiro
Order (antigo Buy) Campaign string
Start-Date Campaign Start Date data
End-Date Campaign End Date data
Billing-Invoice-Code Billing Invoice Code string

cidades

Nome do campo 1.0 Nome do campo 2.0 Tipo
City-ID City ID número inteiro
City City string
Creative-Library-Enabled Deprecated (now always 1) número inteiro

países

Nome do campo 1.0 Nome do campo 2.0 Tipo
Country-ID Deprecated número inteiro
Country Deprecated string

anúncios

Nome do campo 1.0 Nome do campo 2.0 Tipo
Advertiser-ID Advertiser ID número inteiro
Rendering-ID Rendering ID número inteiro
UI-Creative-ID descontinuado número inteiro
Creative Creative string
Last-Modified-Date Creative Last Modified Date data
Creative-Type Creative Type string
Creative-Sub-Type Deprecated string
Creative-Size-ID Creative Pixel Size string
Image-URL Creative Image URL string
Creative-Version Creative Version integer

creative_ad_assignments

Nome do campo 1.0 Nome do campo 2.0 Tipo
Ad-ID Ad ID número inteiro
Creative-ID Creative ID número inteiro
Start-Date Creative Start Date data
End-Date Creative End Date data
Rotation-Type Creative Rotation Type string
Creative-Group-1 Creative Groups 1 string
Creative-Group-2 Creative Groups 2 string
Click-URL Ad Click URL string

custom_creative_fields

Nome do campo 1.0 Nome do campo 2.0 Tipo
Advertiser-ID Advertiser ID número inteiro
Creative-ID Creative ID número inteiro
Custom-Field-Number Creative Custom Field Number número inteiro
Custom-Field-Name Creative Custom Field Name string
Custom-Field-Value Creative Custom Field Value string

custom_rich_media

Nome do campo 1.0 Nome do campo 2.0 Tipo
Advertiser-ID Advertiser ID número inteiro
Met-Event-ID Rich Media Event ID número inteiro
Met-Event-Name Rich Media Event string
Met-Event-Type-ID Rich Media Event Type ID integer
Met-Event-Type-Name Rich Media Event Type string

designated_market_areas

Nome do campo 1.0 Nome do campo 2.0 Tipo
DMA-ID Designated Market Area (DMA) ID número inteiro
DMA Designated Market Area string

keyword_values

Nome do campo 1.0 Nome do campo 2.0 Tipo
Ad-ID Ad ID número inteiro
Keyword-Expression Keyword string
Nome do campo 1.0 Nome do campo 2.0 Tipo
Ad-ID Ad ID número inteiro
Advertiser-ID Advertiser ID número inteiro
Buy-ID Campaign ID número inteiro
DS-Ad-ID Paid Search Ad ID número inteiro
Extended-Keyword-ID Paid Search Keyword ID número inteiro
Keyword-ID Paid Search Legacy Keyword ID número inteiro
DS-Campaign-Name Paid Search Campaign string
KW-Ad-Group-Name Paid Search Ad Group string
Bid-Strategy-Name Paid Search Bid Strategy string
Landing-Page-URL Paid Search Landing Page URL string
Keyword-Name Paid Search Keyword string
Match-Type Paid Search Match Type string

operating_systems

Nome do campo 1.0 Nome do campo 2.0 Tipo
OS-ID Operating System ID número inteiro
OS Operating System string

posicionamentos

Nome do campo 1.0 Nome do campo 2.0 Tipo
Buy-ID Campaign ID número inteiro
Site-ID Site ID (DCM) número inteiro
Page-ID Placement ID número inteiro
Page Site keyname string
Site-Placement Placement string
Content-Category Content Category string
Strategy Placement Strategy string
Start-Date Placement Start Date data
End-Date Placement End Date data
Group-Type Tipo de grupo de posições string
Group-Parent-ID ID do pacote/roadblock número inteiro
Price-Type Placement Cost Structure string
Cap-Cost Placement Cap Cost Option float
CPA-Activity-ID Activity ID número inteiro

placement_cost

Nome do campo 1.0 Nome do campo 2.0 Tipo
Page-ID Placement ID número inteiro
Effective-Date Placement Start Date data
End-Date Placement End Date data
Units Placement Total Booked Units número inteiro
Rate Placement Rate ponto flutuante
Comments Placement Comments string

sites

Nome do campo 1.0 Nome do campo 2.0 Tipo
Site-ID Site ID (DCM) número inteiro
Site Site (DCM) string
Directory-Site-ID Site ID (Site Directory) integer
Directory-Site Site (Site Directory) string

estados

Nome do campo 1.0 Nome do campo 2.0 Tipo
State/Province State/Region string
State/Province Name State/Region Full Name string

custom_floodlight_variables

Nome do campo 1.0 Nome do campo 2.0 Tipo
Spot-ID Floodlight Configuration ID número inteiro
Variable-ID Floodlight Variable ID string
Variable-Name Floodlight Variable Name string