إدارة الحوادث في "منصة خرائط Google"

مراحل نشاط حادثة

تلتزم "منصة خرائط Google" بإطار عمل إدارة حوادث Google Cloud Platform.

عند حدوث انقطاع أو انقطاع في الخدمة، يعمل فريق هندسة المنتجات وفريق دعم "منصة خرائط Google" معًا لحل الحادثة وإعلامك بها.

مراحل النشاط

الرصد

تستخدم Google مراقبة داخلية وأسودة لرصد الحوادث وإطلاق تنبيهات للمهندسين لدينا للتحقيق. وللحصول على المزيد من المعلومات، يُرجى الاطّلاع على الفصل السادس من كتاب "هندسة الموقع الإلكتروني" الموثوق به.

إذا رصدت حادثة لم يتم الإبلاغ عنها حتى الآن في أداة تتبّع المشاكل، انتقِل إلى صفحة "إنشاء تجربة دعم" في "منصة خرائط Google" (في Google Cloud Console) وأنشئ تجربة دعم جديدة.

الاستجابة المبدئية

عندما ترصد Google حادثة، يقودك فريق الدعم بالتواصل معك. ونادرًا ما يكون الإشعار الأولي بالحادثة ضئيلاً، وكثيرًا ما يشير إلى المنتج المعنيّ إلى جانب الأعراض الرئيسية فقط. ويرجع ذلك إلى أننا نعطي الأولوية للإشعار السريع على التفاصيل. وسيتم توفير تفاصيل إضافية في التحديثات اللاحقة.

رد

قنوات الاتصال بالحوادث

لتقديم مقدار المعلومات المناسب، يقدّم فريق دعم "منصة خرائط Google" قنوات مختلفة للتواصل مع الحوادث، بناءً على نطاق المشكلة وشدّتها:

تُعد لوحة البيانات الخاصة بالحالة العامة في "خرائط Google" أول مكان يمكن التحقق منه عند اكتشاف مشكلة تؤثر عليك. تعرض لوحة البيانات الحوادث التي تؤثر في العديد من العملاء، لذا إذا لاحظت حادثة تم إدراجها، من المحتمل أن تكون مرتبطة بمشكلتك. للإشارة إلى درجة الخطورة، تعمل لوحة بيانات الحالة على وضع علامة على الحوادث إما بانقطاع الخدمة أو تعطلها، أو تقديم معلومات.

مجموعة إشعارات "منصة خرائط Google" هي إحدى مجموعات Google العامة التي يتم فيها الإبلاغ عن جميع حالات انقطاع الخدمة على نطاق واسع، بالإضافة إلى التحديثات الفنية الأخرى حول واجهات برمجة تطبيقات منصة خرائط Google. سيتلقى جميع أعضاء المجموعة إشعارًا عبر البريد الإلكتروني عند رصد انقطاع في الخدمة بشكلٍ مبدئي يحتوي على تحديثات لاحقة إلى أن يتم حل المشكلة.

بطاقة حالة "منصة خرائط Google" هي رسالة إعلامية تظهر دائمًا في القسم دعم "خرائط Google" في Cloud Console وتعرض الحالة الحالية لواجهات برمجة تطبيقات "منصة خرائط Google" وخدماتها. عندما تكون هناك حادثة نشطة، ستظهر رسالة لتحديد المنتج المتأثّر وتتضمن رابطًا ينقل إلى لوحة البيانات الخاصة بالحالة العامة في "خرائط Google" حيث يمكنك الاطّلاع على الحوادث النشطة.

انقطاع الخدمة

يحتوي أداة تتبّع المشاكل على قائمة مرجعية لجميع الحوادث المعروفة. يمكنك الاطّلاع على الحوادث المفتوحة ومتابعة تقدّمها من خلال الاشتراك فيها وإضافة تعليقات لمساعدة فِرقنا في التحقيق في المسألة. يمكنك أيضًا الاطّلاع على الرابط المؤدي إلى أداة تتبّع المشاكل في مستندات دعم "منصة خرائط Google".

يتم استخدام طلبات الحصول على الدعم إذا كانت المشكلة معزولة عن مشاريعك أو تؤثر في عدد محدود من العملاء. إذا لم يتم الإعلان عن أي حادثة، ولكنك لا تزال تواجه مشكلة، انتقِل إلى صفحة "إنشاء تجربة دعم" في "منصة خرائط Google" (في Cloud Console) وأنشئ تجربة دعم جديدة.

التحقيق

تتحمل فِرق هندسة المنتجات مسؤولية التحقيق في السبب الرئيسي للحوادث. غالبًا ما تتم عملية إدارة الحوادث من خلال مهندسين موثوقين بالموقع، ولكن قد يتم ذلك من خلال مهندسي برامج أو غيرهم، حسب الحالة والمنتج. لمزيد من المعلومات، يُرجى الاطّلاع على الفصل 12 من الكتاب الهندسي بخصوص موثوقية الموقع.

التخفيف/الإصلاح

لا يتم اعتبار المشكلة تم الإصلاح إلا إذا تم إجراء تغييرات تثق بها Google لإنهاء التأثير إلى أجل غير مسمى. على سبيل المثال، يمكن أن يؤدي الإصلاح إلى العودة إلى تغيير أدى إلى وقوع حادثة.

خلال فترة وقوع الحادثة، سيحاول فريقا "الدعم" و"المنتج" التخفيف من المشكلة. يتم الحدّ من حالات حدوث تأثير عندما يتم الحدّ من تأثير مشكلة معيّنة أو نطاقها، مثلاً من خلال تقديم موارد إضافية مؤقتًا لخدمة التحميل الزائد.

في حال عدم العثور على إجراءات للتخفيف من آثار قطع الإنترنت، سيعثر فريق الدعم على حلول سيقدّمها ويتواصل معها، إن أمكن. الحلول هي الخطوات التي يمكنك اتّخاذها لتلبية الحاجة الأساسية على الرغم من الحادثة. وقد يتمثل الحل البديل في استخدام إعدادات مختلفة لاستدعاء واجهة برمجة التطبيقات لتجنب مسار رمز ينطوي على مشكلة.

متابعة

أثناء استمرار المشكلة، يقدِّم فريق الدعم تحديثات منتظمة. تقدم التحديثات عادةً ما يلي:

  • مزيد من المعلومات حول الحادثة، مثل رسائل الخطأ والميزات المتأثرة ومدى انتشارها
  • مدى التقدّم نحو التخفيف، بما في ذلك أي حلول بديلة.
  • الجداول الزمنية للتواصل مخصّصة للفعالية
  • التغييرات في الحالة، مثل وقت إصلاح حادثة

بعد اكتمال المشروع

تؤدي جميع الحوادث إلى إجراء تحليل داخلي (بعد الحادثة) لفهم الحادثة بشكل كامل وتحديد التحسينات التي يمكن إجراؤها على الموثوقية من خلال Google. وبعد ذلك، يتم تتبّع هذه التحسينات وتنفيذها. لمزيد من المعلومات حول تحليل ما بعد اكتمال الفعاليات في Google، يُرجى الاطّلاع على الفصل 15 من كتاب الموثوقية على الموقع الإلكتروني.

تقرير الحوادث

عندما يكون للحوادث تأثير كبير جدًا وكبير جدًا، تقدّم Google تقارير الحوادث التي توضح الأعراض وتأثيرها والسبب الأساسي ومعالجتها والوقاية منها في المستقبل. كما هو الحال بالنسبة إلى مرحلة ما بعد اكتمال المشاريع، نولي اهتمامًا خاصًا بالخطوات التي نتّخذها للتعلّم من المشكلة وتحسين الموثوقية. إنّ هدف Google في كتابة وإطلاق المشاريع بعد اكتمال المشروع هو أن تكون شفافًا وإثبات التزامنا بتوفير خدمات ثابتة لعملائنا.

الأسئلة الشائعة

أريد تلقّي إشعار عند انقطاع الخدمة باستمرار. ماذا يجب أن أفعل؟

  • انضم إلى مجموعة إشعارات "منصة خرائط Google" لتلقّي إشعارات بشأن المشاكل الجارية ومتابعة تقدّم الحادثة في الوقت الفعلي. ستساعدك هذه المجموعة أيضًا في الاطّلاع على آخر الأخبار حول المنتجات والمنصّات.
  • استخدِم رابطَي خلاصة RSS أو سجلّ JSON في أسفل لوحة البيانات الخاصة بالحالة العامة في "خرائط Google" للاطّلاع على خلاصة للحوادث الحالية والسابقة. ستؤدي كل مشاركة إلى لوحة البيانات إلى ظهور مشاركة على الخلاصة. للاطّلاع على آخر الأخبار، ستتضمّن كل مشاركة في الخلاصة جميع الرسائل والتحديثات المتعلّقة بحدث لوحة البيانات المقابل. بهذه الطريقة، لن تحتاج إلى الاطّلاع على سجلّ خلاصاتك للاطّلاع على التقدّم الذي أحرزته. يتم نشر خلاصات RSS بتنسيق XML. تتيح لك إضافات المتصفّح، مثل إضافة الاشتراك في RSS (من Google) معاينة محتوى الخلاصة والاشتراك في قارئ RSS المفضّل لديك. سجلّ JSON هو خلاصة ويب JSON للحوادث السابقة. مجموعة من مكتبات البرامج وأُطر العمل على الويب لدعم مشاركة المحتوى من خلال خلاصة JSON

ما هو نوع معلومات الحالة التي يمكنني العثور عليها في الصفحة الرئيسية للوحة البيانات؟

تقدّم لوحة البيانات الخاصة بالحالة العامة في "خرائط Google" معلومات عن واجهات برمجة التطبيقات والخدمات التي تشكّل جزءًا من "منصة خرائط Google". في حال وقوع حادثة نشطة، سيتم نشر المعلومات هنا لكل واجهة برمجة تطبيقات محدّدة وخدمة معيّنة ضمن "منصة خرائط Google". يتم دائمًا عرض مؤشرات الحالة، ما يمثّل الصحة العامة لكل واجهة برمجة تطبيقات وخدمة من أيٍّ مما يلي:

  • انقطاع الخدمة: تعطّل نظام أو خدمة إنتاج. الحل غير متاح أو لا يمكن تنفيذه بسهولة.
  • انقطاع الخدمة: تعطل خدمة الإنتاج أو نظام الإنتاج بشكل جزئي جزئيًا و/أو لا تعمل على النحو المتوقّع. الحل موجود.
  • معلومات الخدمة: يواجه نظام الإنتاج أو الخدمة مشكلة في الأداء بشكل جزئي و/أو لا يعمل على النحو المتوقّع. وبوجهٍ عام، ستظل الخدمة متاحة، والتأثير بسيط، وسيؤثر في عدد قليل من المستخدمين.
  • متوفّرة: الخدمة تعمل بشكل كامل وتعمل على النحو المطلوب.

هل يتم عرض لوحة البيانات في الوقت الفعلي؟

تهدف لوحة البيانات الخاصة بالحالة العامة في "خرائط Google" إلى توفير حالة المنتجات في الوقت الفعلي تقريبًا المتوفّرة بشكل عام والتي تشملها اتفاقية مستوى الخدمة في "خرائط Google". ويتم التحقّق من جميع الحوادث قبل نشر المحتوى للمرة الأولى، لذلك قد يحدث تأخير بسيط في وقت رصدها للمرة الأولى. وبالتالي، يجب عدم استخدام لوحة البيانات لأغراض تتبّع مدة التشغيل.

هل يمكنني استخدام لوحة البيانات لمراقبة مدة تشغيل "منصة خرائط Google"؟

لا يُقصد من "لوحة بيانات الحالة العامة" للخرائط مراقبة حالة خدمات "منصة Google للتسويق" استنادًا إلى اتفاقية مستوى الخدمة في "منصة Google للتسويق" نظرًا لأن فترات الانقطاع التي تظهر في لوحة البيانات قد لا تعكس "وقت التوقّف عن العمل" الفعلي (كما هو موضّح في "اتفاقية مستوى الخدمة") لمشروعك، خاصةً في ما يتعلق بالحوادث الأقل خطورة. بالإضافة إلى ذلك، قد تتضمن المُدد المعروضة وقتًا إضافيًا بعد تخفيف المشكلة لتأكيد الإصلاح بالكامل.

لتتبُّع استخدام واجهة برمجة التطبيقات وإنشاء لوحات بيانات وإنشاء تنبيهات، انتقِل إلى مراقبة "منصة خرائط Google".

ماذا لو لم يظهر لي حادث على لوحة البيانات؟

لا تتأثر بعض العملاء والمشاريع بسبب كل حادثة. ولا تظهر في لوحة البيانات سوى الحوادث الواسعة والخطيرة. إذا واجهت مشكلة غير مُدرَجة في لوحة البيانات، يمكنك التواصل مع فريق الدعم .

أين يمكنني العثور على معلومات عن حالات انقطاع الخدمة وانقطاع الخدمة السابقة؟

تتضمّن صفحة السجلّ في "لوحة البيانات الخاصة بالحالة العامة" في "خرائط Google" مستودعًا لحالات انقطاع الخدمة وحالات انقطاع الخدمة عن آخر 365 يومًا. انقر على إحدى الحوادث لمراجعة المشاركات المتعلقة بالحادثة عندما كانت جارية، بالإضافة إلى أي تقارير الحوادث التي نشرها فريق الدعم.

من المسؤول عن تعديل لوحة البيانات؟

يراقب فريق دعم "منصة خرائط Google" العالمي حالة الخدمات باستخدام العديد من أنواع الإشارات المختلفة، ويُعدِّل لوحة البيانات في حال حدوث مشكلة واسعة النطاق. إذا لزم الأمر، سينشر الفريق تقريرًا تحليليًا مفصّلاً بعد حلّ الحادثة.

ما الفرق بين "حادثة" و"انقطاع"؟

على الرغم من أنّ هذه المصطلحات تُستخدَم غالبًا بالتبادل، تستخدم لوحة البيانات الخاصة بالحالة العامة في "خرائط Google" واتصالاتنا الخارجية "الحادثة" للإشارة إلى أي فترة من انقطاع الخدمة و"انقطاع الخدمة" للإشارة إلى الحالات الأكثر عصيبة، حيث لا تعمل الخدمة بالقدر الذي يجعلها تجربة غير مفيدة للعملاء.