Tải tập dữ liệu

Sau khi tạo một tập dữ liệu và tải dữ liệu lên, bạn có thể sử dụng yêu cầu HTTP GET để truy cập vào tập dữ liệu. Trang này mô tả cách liệt kê tất cả các tập dữ liệu của bạn, cách xem thông tin về một tập dữ liệu cụ thể và cách tải dữ liệu xuống của một tập dữ liệu.

Giới thiệu về các phiên bản tập dữ liệu

Sau khi tải dữ liệu lên thành công, trạng thái của tập dữ liệu được đặt thành STATE_COMPLETED và tập dữ liệu đó sẽ trở thành phiên bản hoạt động. Điều đó có nghĩa là sẵn sàng để sử dụng trong ứng dụng của bạn. Để xác định state của tập dữ liệu, bạn có thể liệt kê tất cả các tập dữ liệu hoặc nhận một tập dữ liệu cụ thể.

Bạn có thể tải dữ liệu mới lên tập dữ liệu để tạo phiên bản mới của tập dữ liệu:

  • Nếu dữ liệu mới tải lên thành công, phiên bản mới sẽ có trạng thái "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

  • Nếu có lỗi trong quá trình tải lên, thì phiên bản tập dữ liệu thành công trước đó vẫn là trạng thái "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

Để biết thêm thông tin về cách tạo phiên bản mới của một tập dữ liệu, hãy xem Tải dữ liệu mới lên tập dữ liệu.

Liệt kê tất cả tập dữ liệu

Liệt kê tất cả các tập dữ liệu bằng cách gửi yêu cầu HTTP GET đến liệt kê điểm cuối của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

Yêu cầu này trả về thông tin về phiên bản mới nhất của tất cả các tập dữ liệu, bất kể phiên bản đó có phải là phiên bản đang hoạt động hay không. Nếu bạn chỉ muốn liệt kê phiên bản đang hoạt động của mỗi tập dữ liệu, hãy thêm tham số truy vấn tag=active đối với yêu cầu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets?tag=active

Ví dụ: lệnh gọi này trả về thông tin về phiên bản mới nhất của tất cả tập dữ liệu:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"

Lệnh gọi này trả về phản hồi trong biểu mẫu:

{
  "datasets": [
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
      "displayName": "My Test Dataset",
      "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "gcsSource": {
        "inputUri": "gs://mybucket/my.csv",
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:47:37.308977Z",
      "updateTime": "2023-03-24T14:48:05.053114Z",
      "versionCreateTime": "2023-03-24T14:48:05.053114Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    },
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/2c8ae479-96704-89c6435ca959",
      "displayName": "My Other Test Dataset",
      "versionId": "0d2e3-b9da-47cc-819f-7ac67562",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "localFileSource": {
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:41:52.579755Z",
      "updateTime": "2023-03-24T14:42:56.784122Z",
      "versionCreateTime": "2023-03-24T14:42:56.784122Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    }
  ]
}

Nhận thông tin về một tập dữ liệu

Để nhận thông tin về một tập dữ liệu cụ thể, hãy gửi yêu cầu HTTP GET đến điểm cuối nhận tập dữ liệu mà cũng bao gồm mã nhận dạng của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID

Yêu cầu này trả về thông tin về phiên bản mới nhất của tập dữ liệu, bất kể phiên bản đó có phải là phiên bản đang hoạt động hay không. Nếu bạn muốn biết thông tin về phiên bản đang hoạt động của tập dữ liệu, hãy thêm thẻ @active vào yêu cầu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@active

Ví dụ:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46@active"

Yêu cầu này trả về phản hồi trong biểu mẫu:

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
  "displayName": "My Test Dataset",
  "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "gcsSource": {
    "inputUri": "gs://mybucket/my.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2023-03-24T14:47:37.308977Z",
  "updateTime": "2023-03-24T14:48:05.053114Z",
  "versionCreateTime": "2023-03-24T14:48:05.053114Z",
  "status": {
    "state": "STATE_COMPLETED"
  }
}

Tải tập dữ liệu xuống

Để tải dữ liệu xuống từ phiên bản mới nhất của một tập dữ liệu, hãy gửi một HTTP GET yêu cầu đến tải tập dữ liệu xuống điểm cuối có bao gồm mã nhận dạng của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:download?alt=media

Ví dụ:

curl -X GET -L \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
--output LOCAL_LOCATION_TO_OUTPUT \
"https://mapsplatformdatasets.googleapis.com/download/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46:download?alt=media"

Trong ví dụ này, bạn sử dụng tuỳ chọn cURL --output để chỉ định tên của chứa dữ liệu đã tải xuống. Ví dụ: cờ --output sau chỉ định tải tập dữ liệu xuống một tệp có tên myjson.json trong cùng một tệp Thư mục dùng để chạy lệnh cURL:

--output myjson.json

Bạn cũng có thể sử dụng cờ sau để tải dữ liệu xuống tệp myjson.json trong /tmp thư mục:

--output /tmp/myjson.json