Mục tiêu
Hướng dẫn Xác thực địa chỉ khối lượng lớn đã hướng dẫn bạn qua các tình huống khác nhau mà có thể sử dụng xác thực địa chỉ khối lượng lớn. Trong hướng dẫn này, chúng tôi sẽ giới thiệu cho bạn các mẫu thiết kế khác nhau trong Google Cloud Platform để chạy tính năng Xác thực địa chỉ khối lượng lớn.
Chúng ta sẽ bắt đầu bằng thông tin tổng quan về cách chạy tính năng Xác thực địa chỉ khối lượng lớn trong Google Cloud Platform bằng Cloud Run, Compute Engine hoặc Google Kubernetes Engine để thực thi một lần. Sau đó, chúng ta sẽ xem cách đưa chức năng này vào quy trình dữ liệu.
Đến cuối bài viết này, bạn đã hiểu rõ về các tuỳ chọn để chạy tính năng Xác thực địa chỉ với khối lượng lớn trong môi trường Google Cloud.
Cấu trúc tham chiếu trên Google Cloud Platform
Phần này trình bày sâu hơn về các mẫu thiết kế cho tính năng Xác thực địa chỉ khối lượng lớn bằng Google Cloud Platform. Bằng cách chạy trên Google Cloud Platform, bạn có thể tích hợp với các quy trình và kênh dữ liệu hiện có của mình.
Chạy quy trình xác thực địa chỉ khối lượng lớn một lần trên Google Cloud Platform
Dưới đây là cấu trúc tham khảo về cách tạo chế độ tích hợp trên Google Cloud Platform phù hợp hơn cho các hoạt động hoặc thử nghiệm một lần.
Trong trường hợp này, bạn nên tải tệp CSV lên bộ chứa Cloud Storage. Sau đó, tập lệnh Xác thực địa chỉ khối lượng lớn có thể chạy từ môi trường Cloud Run. Tuy nhiên, bạn có thể thực thi môi trường thời gian chạy này ở bất kỳ môi trường thời gian chạy nào khác như Compute Engine hoặc Google Kubernetes Engine. Bạn cũng có thể tải tệp CSV đầu ra lên bộ chứa Cloud Storage.
Vận hành dưới dạng quy trình dữ liệu trên Google Cloud Platform
Mẫu triển khai đã hiển thị trong phần trước là công cụ tuyệt vời để kiểm tra nhanh tính năng Xác thực địa chỉ khối lượng cao để sử dụng một lần. Tuy nhiên, nếu cần sử dụng nền tảng này thường xuyên trong quy trình dữ liệu, bạn có thể tận dụng các chức năng gốc của Google Cloud Platform để làm cho mô hình mạnh mẽ hơn. Bạn có thể thực hiện một số thay đổi sau:
- Trong trường hợp này, bạn có thể kết xuất tệp CSV vào các bộ chứa Cloud Storage.
- Công việc Dataflow có thể chọn những địa chỉ cần được xử lý rồi lưu vào bộ nhớ đệm trong BigQuery.
- Bạn có thể mở rộng thư viện Dataflow Python để có logic cho tính năng Xác thực địa chỉ khối lượng cao nhằm xác thực các địa chỉ trong công việc Dataflow.
Chạy tập lệnh từ quy trình dữ liệu như một quy trình định kỳ lâu dài
Một phương pháp phổ biến khác là xác thực một loạt địa chỉ trong quy trình truyền trực tuyến dữ liệu dưới dạng một quy trình định kỳ. Bạn cũng có thể có các địa chỉ trong kho dữ liệu BigQuery. Trong phương pháp này, chúng ta sẽ tìm hiểu cách tạo quy trình dữ liệu định kỳ (cần được kích hoạt hằng ngày/hằng tuần/hằng tháng)
- Tải tệp CSV ban đầu lên bộ chứa Cloud Storage.
- Dùng Memorystore như một kho dữ liệu liên tục để duy trì trạng thái trung gian cho quá trình diễn ra lâu dài.
- Lưu các địa chỉ cuối cùng vào bộ nhớ đệm trong kho dữ liệu BigQuery.
- Thiết lập Cloud Scheduler để chạy tập lệnh theo định kỳ.
Cấu trúc này có các ưu điểm sau:
- Bằng cách sử dụng Cloud Scheduler, việc xác thực địa chỉ có thể được thực hiện định kỳ. Bạn có thể muốn xác thực lại địa chỉ hằng tháng hoặc xác thực bất kỳ địa chỉ mới nào hằng tháng/hằng quý. Cấu trúc này giúp giải quyết trường hợp sử dụng đó.
Nếu dữ liệu khách hàng nằm trong BigQuery, thì những địa chỉ đã được xác thực hoặc Cờ xác thực có thể được lưu vào bộ nhớ đệm ngay trong bộ nhớ đệm đó. Lưu ý: Những nội dung có thể được lưu vào bộ nhớ đệm và cách mô tả chi tiết trong bài viết về Xác thực địa chỉ khối lượng cao
Việc sử dụng Memorystore mang lại khả năng phục hồi và khả năng xử lý nhiều địa chỉ hơn. Các bước này giúp tăng cường tính trạng thái cho toàn bộ quy trình xử lý. Đây là điều cần thiết để xử lý các tập dữ liệu địa chỉ rất lớn. Bạn cũng có thể sử dụng các công nghệ cơ sở dữ liệu khác như Cloud SQL[https://cloud.google.com/sql] hoặc bất kỳ phiên bản cơ sở dữ liệu nào khác mà Google Cloud Platform cung cấp tại đây. Tuy nhiên, chúng tôi tin rằng bộ nhớ lưu trữ hoàn hảo sẽ cân bằng giữa nhu cầu mở rộng và tính đơn giản, do đó, đây nên là lựa chọn hàng đầu.
Kết luận
Bằng cách áp dụng các mẫu được mô tả ở đây, bạn có thể sử dụng API Xác thực địa chỉ cho nhiều trường hợp sử dụng và trong nhiều trường hợp sử dụng trên Google Cloud Platform.
Chúng tôi đã viết một thư viện Python nguồn mở để giúp bạn bắt đầu với các trường hợp sử dụng được mô tả ở trên. Dịch vụ này có thể được gọi từ một dòng lệnh trên máy tính của bạn hoặc có thể được gọi từ Google Cloud Platform hoặc các nhà cung cấp dịch vụ đám mây khác.
Tìm hiểu thêm về cách sử dụng thư viện trong bài viết này.
Các bước tiếp theo
Tải Sách trắng về Cải thiện quy trình thanh toán, giao hàng và hoạt động với địa chỉ đáng tin cậy rồi xem Hội thảo trên web về Cải thiện quy trình thanh toán, giao hàng và hoạt động bằng tính năng xác thực địa chỉ .
Bạn nên đọc thêm:
- Tài liệu về API xác thực địa chỉ
- Mã hoá địa lý và xác thực địa chỉ
- Khám phá Bản minh hoạ về việc xác thực địa chỉ
Người đóng góp
Google duy trì bài viết này. Những cộng tác viên sau đây là người viết bài đầu tiên.
Tác giả chính:
Henrik Valve | Kỹ sư giải pháp
Thomas Anglaret | Kỹ sư giải pháp
Sarthak Ganguly | Kỹ sư giải pháp