أنماط تصميم للتحقق من صحة العناوين ذات الحجم الكبير على Google Cloud Platform

الهدف

أرشدك البرنامج التعليمي "التحقّق من صحة العناوين بكميات كبيرة" خلال سيناريوهات مختلفة يمكن فيها استخدام ميزة "التحقّق من صحة العناوين بكميات كبيرة". في هذا البرنامج التعليمي، سنقدّم لك أنماط تصميم مختلفة ضمن Google Cloud Platform لتشغيل ميزة "التحقّق من صحة العناوين بكميات كبيرة".

سنبدأ بنظرة عامة حول تشغيل ميزة "التحقّق من صحة العناوين بكميات كبيرة" في Google Cloud Platform باستخدام Cloud Run أو Compute Engine أو Google Kubernetes Engine لعمليات التنفيذ لمرة واحدة. سنرى بعد ذلك كيف يمكن تضمين هذه الإمكانية كجزء من مسار البيانات.

في نهاية هذه المقالة، يجب أن يكون لديك فهم جيد للخيارات المختلفة لتشغيل ميزة "التحقّق من صحة العناوين" بكميات كبيرة في بيئة Google Cloud.

بنية مرجعية على Google Cloud Platform

يتناول هذا القسم بالتفصيل أنماط التصميم المختلفة لميزة "التحقّق من صحة العناوين بكميات كبيرة" باستخدام Google Cloud Platform. من خلال التشغيل على Google Cloud Platform، يمكنك التكامل مع عملياتك الحالية ومسارات البيانات.

تشغيل ميزة "التحقّق من صحة العناوين بكميات كبيرة" لمرة واحدة على Google Cloud Platform

في ما يلي بنية مرجعية حول كيفية إنشاء عملية تكامل على Google Cloud Platform تكون أكثر ملاءمة للعمليات أو الاختبارات لمرة واحدة.

الصورة

في هذه الحالة، ننصحك بتحميل ملف CSV إلى مساحة تخزين في Cloud Storage. يمكن بعد ذلك تشغيل نص برمجة "التحقّق من صحة العناوين بكميات كبيرة" من بيئة Cloud Run. ومع ذلك، يمكنك تنفيذه في أي بيئة تشغيل أخرى، مثل Compute Engine أو Google Kubernetes Engine. يمكن أيضًا تحميل ملف CSV الناتج إلى مساحة تخزين في Cloud Storage.

التشغيل كمسار بيانات في Google Cloud Platform

إنّ نمط النشر الموضّح في القسم السابق رائع لاختبار ميزة "التحقّق من صحة العناوين بكميات كبيرة" بسرعة للاستخدام لمرة واحدة. ومع ذلك، إذا كنت بحاجة إلى استخدامها بانتظام كجزء من مسار البيانات، يمكنك الاستفادة بشكل أفضل من الإمكانات الأصلية في Google Cloud Platform لجعلها أكثر فعالية. في ما يلي بعض التغييرات التي يمكنك إجراؤها:

الصورة

  • في هذه الحالة، يمكنك إفراغ ملفات CSV في مساحات تخزين في Cloud Storage.
  • يمكن أن تلتقط مهمة Dataflow العناوين المطلوب معالجتها ثم تخزينها مؤقتًا في BigQuery.
  • يمكن توسيع مكتبة Python في Dataflow لتضمين منطق ميزة "التحقّق من صحة العناوين بكميات كبيرة" للتحقّق من صحة العناوين من مهمة Dataflow.

تشغيل النص البرمجي من مسار بيانات كعملية متكرّرة طويلة الأمد

هناك نهج شائع آخر يتمثل في التحقّق من صحة مجموعة من العناوين كجزء من مسار بيانات البث كعملية متكرّرة. قد تكون العناوين أيضًا في مخزن بيانات BigQuery. في هذا النهج، سنرى كيفية إنشاء مسار بيانات متكرّر (يجب تشغيله يوميًا أو أسبوعيًا أو شهريًا).

الصورة

  • حمِّل ملف CSV الأولي إلى مساحة تخزين في Cloud Storage.
  • استخدِم Memorystore كمخزن بيانات دائم للحفاظ على الحالة المؤقتة للعملية الطويلة الأمد.
  • خزِّن العناوين النهائية مؤقتًا في مخزن بيانات BigQuery.
  • اضبط Cloud Scheduler لتشغيل النص البرمجي بشكل دوري.

تتميز هذه البنية بالمزايا التالية:

  • باستخدام Cloud Scheduler، يمكن التحقّق من صحة العناوين بشكل دوري. قد تحتاج إلى إعادة التحقّق من صحة العناوين شهريًا أو التحقّق من صحة أي عناوين جديدة شهريًا أو كل ثلاثة أشهر. تساعد هذه البنية في حلّ حالة الاستخدام هذه.
  • إذا كانت بيانات العملاء في BigQuery، يمكن تخزين العناوين التي تم التحقّق من صحتها أو علامات التحقّق من الصحة مؤقتًا مباشرةً هناك. ملاحظة: يتم وصف ما يمكن تخزينه مؤقتًا وكيفية ذلك بالتفصيل في مقالة "التحقّق من صحة العناوين بكميات كبيرة".

  • يوفر استخدام Memorystore مرونة أعلى وإمكانية معالجة المزيد من العناوين. تضيف هذه الخطوة حالة إلى مسار المعالجة بالكامل، وهو ما يلزم للتعامل مع مجموعات بيانات العناوين الكبيرة جدًا. يمكن أيضًا استخدام تقنيات قواعد البيانات الأخرى، مثل Cloud SQL[https://cloud.google.com/sql] أو أي نوع آخر من قواعد البيانات التي توفّرها Google Cloud Platform. ومع ذلك، نعتقد أنّ Memorystore يوازن بشكل مثالي بين احتياجات التوسيع والبساطة، لذا يجب أن يكون الخيار الأول.

الخاتمة

من خلال تطبيق الأنماط الموضّحة هنا، يمكنك استخدام Address Validation API لحالات استخدام مختلفة ومن حالات استخدام مختلفة على Google Cloud Platform.

لقد أنشأنا مكتبة Python مفتوحة المصدر لمساعدتك في البدء بحالات الاستخدام الموضّحة أعلاه. يمكن استدعاؤها من سطر الأوامر على جهاز الكمبيوتر أو من Google Cloud Platform أو غيرها من موفّري الخدمات السحابية.

مزيد من المعلومات حول كيفية استخدام المكتبة من هذه المقالة.

الخطوات التالية

نزِّل المستند التقني تحسين عملية الدفع والتسليم والعمليات باستخدام عناوين موثوقة وشاهِد الندوة الإلكترونية تحسين عملية الدفع والتسليم والعمليات باستخدام Address Validation .

ننصحك بالاطّلاع على ما يلي:

المساهمون

هذه المقالة من إعداد Google. وقد كتبها المساهمون التاليون في الأصل.
Principal authors:

Henrik Valve | Solutions Engineer
Thomas Anglaret | Solutions Engineer
Sarthak Ganguly | Solutions Engineer