การสร้างชุดข้อมูลเป็นกระบวนการ 2 ขั้นตอน ดังนี้
ส่งคําขอสร้างชุดข้อมูล
ส่งคําขออัปโหลดข้อมูลไปยังชุดข้อมูล
หลังจากอัปโหลดข้อมูลครั้งแรกแล้ว คุณสามารถอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้
สร้างชุดข้อมูล
สร้างชุดข้อมูลโดยส่งคําขอ POST ไปยังปลายทาง datasets
https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets
ส่งเนื้อหา JSON ไปยังคำขอที่กําหนดชุดข้อมูล คุณต้องปฏิบัติดังนี้
ระบุ
displayNameของชุดข้อมูล ค่าของdisplayNameต้องไม่ซ้ำกันสำหรับชุดข้อมูลทั้งหมดตั้งค่า
usageเป็นUSAGE_DATA_DRIVEN_STYLING
เช่น
curl -X POST -d '{
"displayName": "My Test Dataset",
"usage": "USAGE_DATA_DRIVEN_STYLING"
}' \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer $TOKEN" \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"การตอบกลับจะมีรหัสของชุดข้อมูลในรูปแบบ projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID พร้อมด้วยข้อมูลเพิ่มเติม ใช้รหัสชุดข้อมูลเมื่อส่งคำขออัปเดตหรือแก้ไขชุดข้อมูล
{
"name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
"displayName": "My Test Dataset",
"usage": [
"USAGE_DATA_DRIVEN_STYLING"
],
"createTime": "2022-08-15T17:50:00.189682Z",
"updateTime": "2022-08-15T17:50:00.189682Z"
}
อัปโหลดข้อมูลไปยังชุดข้อมูล
หลังจากสร้างชุดข้อมูลแล้ว ให้อัปโหลดข้อมูลจาก Google Cloud Storage หรือจากไฟล์ในเครื่องไปยังชุดข้อมูล
การดำเนินการอัปโหลดเป็นแบบไม่พร้อมกัน หลังจากอัปโหลดข้อมูลแล้ว ระบบจะส่งผ่านและประมวลผลข้อมูล ซึ่งหมายความว่าคุณต้องส่งคําขอ HTTP GET เพื่อตรวจสอบสถานะชุดข้อมูลเพื่อดูว่าชุดข้อมูลพร้อมใช้งานเมื่อใดหรือมีข้อผิดพลาดใดๆ เกิดขึ้นหรือไม่ ดูข้อมูลเพิ่มเติมได้ที่ดูสถานะการประมวลผลข้อมูล
อัปโหลดข้อมูลจาก Cloud Storage
คุณอัปโหลดจาก Cloud Storage ไปยังชุดข้อมูลได้โดยส่งPOSTคําขอไปยังปลายทางชุดข้อมูลที่ระบุรหัสของชุดข้อมูลด้วย
https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import
ในส่วนเนื้อหาคำขอ JSON
ใช้
inputUriเพื่อระบุเส้นทางไฟล์ไปยังทรัพยากรที่มีข้อมูลใน Cloud Storage เส้นทางนี้อยู่ในรูปแบบgs://GCS_BUCKET/FILEผู้ใช้ที่ส่งคำขอต้องมีบทบาทผู้ดูออบเจ็กต์พื้นที่เก็บข้อมูล หรือบทบาทอื่นๆ ที่มีสิทธิ์
storage.objects.getดูข้อมูลเพิ่มเติมเกี่ยวกับการจัดการสิทธิ์เข้าถึง Cloud Storage ได้ที่ภาพรวมการควบคุมการเข้าถึงใช้
fileFormatเพื่อระบุรูปแบบไฟล์ของข้อมูลเป็นFILE_FORMAT_GEOJSON(ไฟล์ GeoJson),FILE_FORMAT_KML(ไฟล์ KML) หรือFILE_FORMAT_CSV(ไฟล์ CSV)
เช่น
curl -X POST -d '{
"gcs_source":{
"inputUri": "gs://my_bucket/my_csv_file",
"fileFormat": "FILE_FORMAT_CSV"
}
}' \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H "content-type: application/json" \
-H "Authorization: Bearer $TOKEN" \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"คำตอบอยู่ในรูปแบบ
{
"name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER"
}
อัปโหลดข้อมูลจากไฟล์
หากต้องการอัปโหลดข้อมูลจากไฟล์ ให้ส่งคำขอ HTTP POST ไปยังปลายทาง datasets ที่มีรหัสของชุดข้อมูลด้วย ดังนี้
https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import
คำขอประกอบด้วยข้อมูลต่อไปนี้
ตั้งค่าส่วนหัว
Goog-Upload-Protocolเป็นmultipartพร็อพเพอร์ตี้
metadataที่ระบุเส้นทางไปยังไฟล์ที่ระบุประเภทข้อมูลที่จะอัปโหลด ซึ่งอาจเป็นFILE_FORMAT_GEOJSON(ไฟล์ GeoJSON),FILE_FORMAT_KML(ไฟล์ KML) หรือFILE_FORMAT_CSV(ไฟล์ CSV)เนื้อหาของไฟล์นี้มีรูปแบบดังนี้
{"local_file_source": {"file_format": "FILE_FORMAT_GEOJSON"}}พร็อพเพอร์ตี้
rawdataที่ระบุเส้นทางไปยังไฟล์ GeoJSON, KML หรือ CSV ซึ่งมีข้อมูลที่อัปโหลด
คําขอต่อไปนี้ใช้ตัวเลือก curl -F เพื่อระบุเส้นทางไปยังไฟล์ 2 ไฟล์
curl -X POST \ -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \ -H "Authorization: Bearer $TOKEN" \ -H "X-Goog-Upload-Protocol: multipart" \ -F "metadata=@csv_metadata_file" \ -F "rawdata=@csv_data_file" \ "https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"
คำตอบอยู่ในรูปแบบ
{
"name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER"
}
รับสถานะการประมวลผลข้อมูล
การดำเนินการอัปโหลดเป็นแบบไม่พร้อมกัน ซึ่งหมายความว่าหลังจากการเรียก API เพื่ออัปโหลดข้อมูลไปยังชุดข้อมูลแสดงผลแล้ว คุณต้องตรวจสอบชุดข้อมูลเพื่อดูว่าการนำเข้าและการประมวลผลข้อมูลสําเร็จหรือไม่
หากต้องการระบุ state ของชุดข้อมูล ให้ใช้รับชุดข้อมูล เช่น ขณะที่ประมวลผลข้อมูล ระบบจะตั้งค่า state เป็น STATE_PROCESSING เมื่อชุดข้อมูลพร้อมใช้งานในแอป state จะตั้งค่าเป็น STATE_COMPLETED
เช่น เรียกใช้ GET ในชุดข้อมูล
curl -X GET \ -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46"
state ของชุดข้อมูลจะเท่ากับ STATE_COMPLETED ในกรณีอัปโหลดสําเร็จ
{ "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46", "displayName": "My Test Dataset", "description": " ", "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218", "usage": [ "USAGE_DATA_DRIVEN_STYLING" ], "localFileSource": { "filename": "Parks_Properties_20240529.csv", "fileFormat": "FILE_FORMAT_CSV" }, "createTime": "2024-05-30T16:41:11.130816Z", "updateTime": "2024-05-30T16:41:14.416130Z", "versionCreateTime": "2024-05-30T16:41:14.416130Z", "status": { "state": "STATE_COMPLETED", }, "sizeBytes": "6916924", "downloadable": true }
เมื่อการประมวลผลข้อมูลไม่สำเร็จ ระบบจะตั้งค่า state เป็นค่าอื่นที่ไม่ใช่ STATE_COMPLETED เช่น STATE_PUBLISHING_FAILED หรือสถานะใดก็ตามที่ลงท้ายด้วยสตริง _FAILED
เช่น คุณอัปโหลดข้อมูลไปยังชุดข้อมูล แล้วส่งคําขอ GET เพื่อรับรายละเอียดชุดข้อมูล นอกเหนือจากพร็อพเพอร์ตี้ state แล้ว คำตอบยังมีพร็อพเพอร์ตี้ errorMessage รายการเดียวที่มีคำอธิบายข้อผิดพลาดด้วย
{ "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46", "displayName": "My Test Dataset", "description": " ", "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218", "usage": [ "USAGE_DATA_DRIVEN_STYLING" ], "localFileSource": { "filename": "Parks_Properties_20240529.csv", "fileFormat": "FILE_FORMAT_CSV" }, "createTime": "2024-05-30T16:41:11.130816Z", "updateTime": "2024-05-30T16:41:14.416130Z", "versionCreateTime": "2024-05-30T16:41:14.416130Z", "status": { "state": "STATE_PUBLISHING_FAILED", "errorMessage": "INVALID_ARGUMENT: Skipping row because address could not be geocoded: 5521 18 AVENUE (from line 79)" }, "sizeBytes": "6916924", "downloadable": true }
รับข้อผิดพลาดในการประมวลผลข้อมูล
เมื่อการนำเข้าและการประมวลผลข้อมูลไม่สําเร็จ พร็อพเพอร์ตี้ errorMessage จะมีข้อความเดียวที่อธิบายข้อผิดพลาด อย่างไรก็ตาม ข้อความแสดงข้อผิดพลาดรายการเดียวอาจให้ข้อมูลไม่เพียงพอในการระบุและแก้ไขปัญหา
หากต้องการดูข้อมูลข้อผิดพลาดทั้งหมด ให้เรียกใช้ API ของ fetchDatasetErrors API นี้จะแสดงข้อผิดพลาดในการประมวลผลข้อมูลทั้งหมดที่เชื่อมโยงกับชุดข้อมูล
curl -X GET \ -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors"
การตอบกลับมีอาร์เรย์ errors อาร์เรย์นี้มีข้อผิดพลาดประเภท Status ไม่เกิน 50 ข้อต่อการเรียกใช้ และรองรับข้อผิดพลาดทั้งหมดได้สูงสุด 500 ข้อ
{ "nextPageToken": "cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj", "errors": [ { "code": 3, "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 631)" }, { "code": 3, "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 457)" }, { "code": 3, "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 31)" }, ... ] }
หากมีข้อผิดพลาดมากกว่า 50 ข้อ ซึ่งหมายความว่ามีข้อผิดพลาดมากกว่า 1 หน้า การตอบกลับจะมีโทเค็นหน้าเว็บในช่อง nextPageToken
ส่งค่านั้นในพารามิเตอร์การค้นหา pageToken ของคอลที่เรียกใช้ครั้งถัดไปเพื่อรับหน้าถัดไปของข้อผิดพลาด เมื่อ nextPageToken ว่างเปล่า แสดงว่าไม่มีหน้าเว็บอีก
ตัวอย่างเช่น หากต้องการดูหน้าถัดไปของข้อผิดพลาดโดยใช้โทเค็นจากคำตอบก่อนหน้า ให้ทำดังนี้
curl -X GET \ -H "content-type: application/json" \ -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors?pageToken=cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj"
โดยค่าเริ่มต้น การตอบกลับจะมีข้อผิดพลาดได้สูงสุด 50 รายการต่อหน้า ใช้พารามิเตอร์การค้นหา pageSize เพื่อควบคุมขนาดหน้า
อัปโหลดข้อมูลใหม่ไปยังชุดข้อมูล
หลังจากสร้างชุดข้อมูลและอัปโหลดข้อมูลเริ่มต้นเรียบร้อยแล้ว ระบบจะตั้งค่าสถานะของชุดข้อมูลเป็น STATE_COMPLETED ซึ่งหมายความว่าชุดข้อมูลพร้อมใช้งานในแอปแล้ว หากต้องการดู state ของชุดข้อมูล ให้ดูที่หัวข้อรับชุดข้อมูล
นอกจากนี้ คุณยังอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้ด้วย หากต้องการอัปโหลดข้อมูลใหม่ ให้ใช้กระบวนการเดียวกับที่ใช้อัปโหลดข้อมูลจาก Cloud Storage หรืออัปโหลดข้อมูลจากไฟล์ แล้วระบุข้อมูลใหม่ที่จะอัปโหลด
หากอัปโหลดข้อมูลใหม่สำเร็จ ให้ทำดังนี้
สถานะของชุดข้อมูลเวอร์ชันใหม่คือ
STATE_COMPLETEDเวอร์ชันใหม่จะกลายเป็นเวอร์ชัน "ใช้งานอยู่" และเป็นเวอร์ชันที่แอปของคุณใช้
หากการอัปโหลดมีข้อผิดพลาด ให้ทำดังนี้
สถานะของชุดข้อมูลเวอร์ชันใหม่ได้รับการตั้งค่าเป็นสถานะอย่างใดอย่างหนึ่งต่อไปนี้
STATE_IMPORT_FAILEDSTATE_PROCESSING_FAILEDSTATE_PUBLISHING_FAILEDSTATE_DELETION_FAILED
เวอร์ชันชุดข้อมูลก่อนหน้าที่อัปเดตสำเร็จจะยังคงเป็นเวอร์ชัน "ที่ใช้งานอยู่" และเป็นเวอร์ชันที่แอปของคุณใช้