Sử dụng Tài khoản đăng nguồn cấp dữ liệu chung

Tài khoản đăng nguồn cấp dữ liệu chung cho phép tải nhiều loại nguồn cấp dữ liệu lên một một dropbox cho mỗi môi trường. Hướng dẫn này sẽ chỉ cho bạn cách sử dụng Tài khoản đăng chung và cung cấp đường liên kết đến hướng dẫn phù hợp cho các mà bạn dự định sử dụng.

(Vui lòng tham khảo Xuất nguồn cấp dữ liệu (từ đầu đến cuối) hoặc phần Nguồn cấp dữ liệu (khởi động) của tài liệu).

Tài khoản đăng chung dựa vào hai tệp tải lên riêng biệt:

  1. Tệp mô tả: mô tả loại nguồn cấp dữ liệu bạn sẽ dùng đang tải lên
  2. (Các) tệp nguồn cấp dữ liệu: nội dung của nguồn cấp dữ liệu thực tế

Cấu trúc trường mô tả

Tệp mô tả được tải lên để cho hệ thống của chúng tôi biết bạn dùng loại nguồn cấp dữ liệu nào đang tải lên. Việc này giúp chúng tôi xác thực và xử lý nguồn cấp dữ liệu một cách chính xác. Chiến lược phát hành đĩa đơn tệp mô tả phải được tải lên trước nội dung nguồn cấp dữ liệu và phải tuân thủ các yêu cầu đặt tên sau:

  • Dùng đuôi tệp .filesetdesc.json
  • Mỗi tên tệp mô tả phải là duy nhất và không thể sử dụng lại trong các lần tải lên. T4 bạn nên đưa dấu thời gian tạo vào tên tệp.
    • Ví dụ: offer_1524606581.filesetdesc.json
message FilesetDescriptor {
  // The timestamp at which this feed was generated, in Unix time format
  // (seconds since the epoch). (required)
  int64 generation_timestamp = 1;

  // Identifies the name of this feed. (required)
  string name = 2;

  // Paths (relative to the dropbox root) specifying data files included in this
  // feed. (required)
  repeated string data_file = 3;
}

Trường name có thể mang các giá trị sau:

Tệp mô tả JSON mẫu cho nguồn cấp dữ liệu sản phẩm có hai phân đoạn là có sẵn bên dưới:

{
  "generation_timestamp": 1524606581,
  "name": "promote.offer",
  "data_file": [
    "offers_1524606581_1.json",
    "offers_1524606581_2.json"
  ]
}

Cấu trúc nội dung nguồn cấp dữ liệu

Sau khi tải tệp mô tả lên, bạn sẽ tải tất cả các tệp nguồn cấp dữ liệu lên cho loại dữ liệu của nguồn cấp dữ liệu tương ứng với tệp cấu hình của nguồn cấp dữ liệu được đặt tên theo tệp mô tả của bạn. Tên tệp và vị trí đường dẫn (tương đối trong dropbox) phải khớp chính xác với nội dung có trong Trường data_file. Nếu có tệp nào bị thiếu, đặt tên không đúng, hoặc được tải lên một vị trí khác thì toàn bộ nguồn cấp dữ liệu sẽ không được đã xử lý.

Nội dung của các tệp dữ liệu trong nguồn cấp dữ liệu này phải tuân thủ các thông số có liên quan của nguồn cấp dữ liệu được chỉ định trong tệp mô tả.

Mỗi tên tệp trong nguồn cấp dữ liệu phải là duy nhất và không thể dùng lại trong các lần tải lên. Bạn nên bao gồm dấu thời gian tạo và số phân đoạn (mã nhận dạng tăng dần) trong tên tệp.

  • Ví dụ: offer_1524606581_1.json

Kích thước tệp nguồn cấp dữ liệu và tần suất tải lên

  • Giữ kích thước tệp nguồn cấp dữ liệu dưới 200 MB (sau khi nén).
  • Hầu hết các công cụ tích hợp sẽ chỉ cần sử dụng một phân đoạn duy nhất. Bạn nên dùng làm ít phân đoạn nhất có thể. Mỗi nguồn cấp dữ liệu có tối đa 1.000 phân đoạn.
  • Các bản ghi riêng lẻ được gửi trong một phân đoạn không cần được gửi trong cùng một phân đoạn số phân đoạn trong nguồn cấp dữ liệu trong tương lai.
  • Để có hiệu suất tốt hơn, hãy chia đều dữ liệu giữa các phân đoạn, để làm cho tất cả các tệp phân đoạn có kích thước tương tự.
  • Nếu cần, hãy sử dụng gzip để nén nguồn cấp dữ liệu. Tuy nhiên, hãy làm như vậy cho mỗi phân đoạn nguồn cấp dữ liệu riêng lẻ.

Khắc phục sự cố và gỡ lỗi

Sau khi tải các tệp của bạn (tệp mô tả và tệp nguồn cấp dữ liệu), hãy truy cập vào Trang tổng quan Nhật ký nguồn cấp dữ liệu (tài liệu) trên Cổng đối tác (chuyển đến Nhật ký > Nguồn cấp dữ liệu) để theo dõi tiến trình nhập nguồn cấp dữ liệu của bạn.

Tìm name mà bạn đã nhập trong tệp mô tả trong "Tên nguồn cấp dữ liệu" để tìm nguồn cấp dữ liệu của bạn.

Sau khi nhập nguồn cấp dữ liệu (trạng thái là Success hoặc Fail), bạn có thể nhấp vào hàng để xem thông tin chi tiết về lỗi và cảnh báo.