إدارة الحوادث في "منصة خرائط Google"

دورة حياة الحادث

تلتزم "منصة خرائط Google" بإطار عمل "إدارة الحوادث" في Google Cloud Platform.

عند حدوث انقطاع في الخدمة أو تدهور الخدمة، يتعاون فريق هندسة المنتج وفريق دعم "منصة خرائط Google" لحل الحادث وإبلاغك به.

lifecycle

الرصد

تستخدم Google ميزة المراقبة الداخلية والصندوق الأسود لرصد الحوادث وإطلاق تنبيهات لمهندسينا ليحقّقوا فيها. لمزيد من المعلومات، راجِع الفصل 6 من كتاب هندسة موثوقية الموقع الإلكتروني.

إذا اكتشفت حادثة لم يتم الإبلاغ عنها بعد في أداة تتبُّع المشاكل، انتقِل إلى صفحة إنشاء طلب دعم في "منصة خرائط Google" (في Google Cloud Console) وأنشِئ طلب دعم جديدًا.

الاستجابة المبدئية

وعندما تكتشف Google حادثًا، يقود فريق الدعم عملية التواصل معك. وغالبًا ما يكون الإشعار الأولي بالحادثة متفرقًا، بحيث يذكر في كثير من الأحيان المنتج المعنيّ فقط إلى جانب الأعراض الرئيسية. ويرجع ذلك إلى أنّنا نعطي الأولوية للإشعار السريع على التفاصيل. ورغم حصولنا على مزيد من المعلومات، يتم توفير تفاصيل إضافية في التعديلات اللاحقة.

رد

قنوات التواصل مع الحوادث

لتوفير مقدار المعلومات المناسبة، يوفِّر فريق دعم "منصة خرائط Google" قنوات مختلفة للتواصل بشأن الحوادث، وذلك بناءً على نطاق المشكلة ودرجة خطورتها:

إن لوحة بيانات الحالة العامة للخرائط هي أول مكان يتم التحقق منه عندما تكتشف أن هناك مشكلة تؤثر عليك. تعرض لوحة المعلومات الحوادث التي تؤثر في العديد من العملاء، لذلك إذا رأيت أن هناك حادثًا مدرجًا، فمن المحتمل أن يكون مرتبطًا بمشكلتك. للإشارة إلى درجة الخطورة، تضع لوحة بيانات الحالة علامة على الحوادث بصفتها انقطاعًا في الخدمة أو تعطُّلاً أو معلومات.

مجموعة إشعارات "منصة خرائط Google" هي مجموعة عامة من Google يتم فيها الإبلاغ عن جميع حالات انقطاع الخدمة على نطاق واسع، بالإضافة إلى آخر الأخبار الفنية حول واجهات برمجة التطبيقات في "منصة خرائط Google". سيتلقى جميع أعضاء المجموعة إشعارًا عبر البريد الإلكتروني عندما يتم اكتشاف انقطاع الخدمة في البداية مع إجراء تحديثات لاحقة إلى أن يتم حل المشكلة.

بطاقة حالة "منصة الخرائط" هي رسالة إعلامية تظهر دائمًا في قسم دعم "خرائط Google" في Cloud Console وتعرض الحالة الحالية لواجهات برمجة تطبيقات "منصة خرائط Google" وخدماتها. عند وقوع حادثة نشطة، ستظهر رسالة تحدد المنتج المتأثر وتتضمن رابطًا يؤدي إلى لوحة البيانات العامة للحالة العامة في "خرائط Google" والتي يمكنك من خلالها الاطّلاع على الحوادث النشطة.

انقطاع في الخدمة

تتضمّن أداة تتبُّع المشاكل قائمة مرجعية تضم جميع الحوادث المعروفة. يمكنك عرض الحوادث المفتوحة ومتابعة تقدُّمها من خلال الاشتراك فيها وإضافة تعليقات لمساعدة فِرقنا على التحقيق في الأمر. يمكنك أيضًا العثور على الرابط المؤدي إلى "أداة تتبُّع المشاكل" في مستندات الدعم في "منصة خرائط Google".

يتم استخدام حالات الدعم إذا كان من الممكن أن تكون المشكلة منفصلة حسب مشروعك(مشروعاتك) أو إذا كانت تؤثر على عدد محدود من العملاء. في حال لم يتم الإعلان عن أي حادثة، ولكن لا تزال تواجه مشكلة، يُرجى الانتقال إلى صفحة إنشاء طلب دعم في "منصة خرائط Google" (في Cloud Console) وإنشاء طلب جديد للحصول على الدعم.

التحقيق

تتولى فِرق هندسة المنتجات مسؤولية التحقيق في السبب الجذري للحوادث. وغالبًا ما يتولى مهندسو موثوقية الموقع إدارة الحوادث، لكن قد ينفّذها مهندسو برامج أو غيرهم وفقًا للوضع والمنتج. لمزيد من المعلومات، راجِع الفصل 12 من كتاب هندسة موثوقية الموقع الإلكتروني.

التخفيف/الإصلاح

لا تُعتبر المشكلة تم إصلاحها إلا عندما يتم إجراء تغييرات بحيث تكون Google واثقة من أنّه ستنهي تأثيرها إلى أجل غير مسمى. على سبيل المثال، يمكن أن يتمثل الإصلاح في التراجع عن تغيير أدّى إلى حدوث حادثة.

وأثناء وقوع الحادثة، سيحاول فريقَي "الدعم" و"المنتج" تخفيف المشكلة. يحدث الحدّ من تأثير المشكلة عندما يمكن الحدّ من تأثيرها أو نطاقها، على سبيل المثال، من خلال توفير موارد إضافية مؤقتًا لخدمة تعاني من أعباء زائدة.

وفي حال عدم العثور على حلول، سيعثر فريق الدعم على الحلول البديلة إذا أمكن ذلك. الحلول البديلة هي خطوات يمكنك اتّخاذها لتلبية الحاجة الأساسية على الرغم من وقوع الحادثة. قد يكون الحل البديل استخدام إعدادات مختلفة لطلب بيانات من واجهة برمجة التطبيقات لتجنُّب مسار رمز يتضمّن مشاكل.

متابعة

أثناء استمرار الحادث، يقدم فريق الدعم تحديثات منتظمة. عادةً ما توفّر التعديلات ما يلي:

  • مزيد من المعلومات حول الحادثة، مثل رسائل الخطأ والميزات المتأثرة بها ومدى انتشارها
  • التقدم نحو التخفيف، بما في ذلك أي حلول بديلة.
  • جداول زمنية للتواصل مخصّصة للحادثة
  • التغييرات في الحالة، مثل وقت إصلاح حادثة.

التقرير التحليلي بعد حدوث الكوارث

تؤدي جميع الحوادث إلى إجراء تحليل داخلي للحادث بعد حدوث الكوارث (ما بعد الحادث) لفهم الحادثة بشكل كامل وتحديد تحسينات الموثوقية التي يمكن أن تجريها Google. بعد ذلك، يتم تتبُّع هذه التحسينات وتنفيذها. لمزيد من المعلومات حول التقارير التحليلية الصادرة بعد حدوث الكوارث في Google، يُرجى الاطّلاع على الفصل 15 من كتاب هندسة موثوقية الموقع الإلكتروني.

تقرير الحوادث

عندما يكون للحوادث آثار كبيرة وخيمة جدًا، تقدّم Google تقارير الحوادث التي توضّح الأعراض وتأثيرها والسبب الجذري لها وعلاجها والوقاية منها في المستقبل. وكما هي الحال بالنسبة إلى التقارير التحليلية الصادرة بعد حدوث الكوارث، فإننا نولي اهتمامًا خاصًا للخطوات التي نتخذها للتعلم من المشكلة وتحسين الموثوقية. تهدف Google كتابيًا وإصدار التقارير التحليلية الصادرة بعد حدوث الكوارث إلى الالتزام بالشفافية وإظهار التزامنا بتقديم خدمات مستقرة لعملائنا.

الأسئلة الشائعة

أريد أن يتم إعلامي عندما يكون هناك انقطاع في الخدمة بشكل مستمر. ماذا يجب أن أفعل؟

  • يمكنك الانضمام إلى مجموعة إشعارات "منصة خرائط Google" لتلقّي إشعارات بشأن المشاكل الجارية ومتابعة مستوى تقدّم الحادثة في الوقت الفعلي. ستساعدك هذه المجموعة أيضًا في البقاء على اطّلاع على الإشعارات المتعلقة بالمنتجات والمنصات.
  • استخدِم روابط خلاصة RSS أو سجلّ JSON أسفل لوحة البيانات الخاصة بالحالة العلنية في "خرائط Google" لعرض خلاصة بالحوادث الحالية والسابقة. ستؤدي كل مشاركة في لوحة البيانات إلى ظهور مشاركة في الخلاصة. بهدف إطلاعك على آخر الأخبار، ستتضمّن كل مشاركة في الخلاصة جميع الرسائل والتعديلات المتعلّقة بحدث لوحة البيانات ذي الصلة. وبهذه الطريقة، لن تحتاج إلى الاطّلاع على سجلّ خلاصاتك لمعرفة مدى تقدّم العملية. يتم نشر خلاصات RSS بتنسيق XML. تتيح لك إضافات المتصفّح، مثل إضافة الاشتراك في RSS (من Google)، معاينة محتوى الخلاصة والاشتراك من خلال قارئ RSS المفضّل لديك. إنّ "سجلّ JSON" هو خلاصة ويب بتنسيق JSON تعرض الحوادث السابقة. هناك مجموعة من مكتبات البرامج وأُطر عمل الويب تتيح مشاركة المحتوى عبر خلاصة JSON.

ما نوع معلومات الحالة التي يمكنني العثور عليها في الصفحة الرئيسية للوحة البيانات؟

توفّر لوحة البيانات الخاصة بالحالة العلنية لتطبيق "خرائط Google" معلومات حول واجهات برمجة التطبيقات والخدمات التي تشكّل جزءًا من "منصة خرائط Google". في حال وقوع حادثة نشطة، سيتم نشر المعلومات هنا لكل واجهة برمجة تطبيقات وخدمة محدّدة ضمن "منصة خرائط Google". يتم دائمًا عرض مؤشرات الحالة التي تشير إلى السلامة العامة لكل واجهة برمجة تطبيقات وخدمة، وذلك من أي مما يلي:

  • انقطاع الخدمة: يعني تعطُّل نظام أو خدمة إنتاج. ولا يتوفّر الحل البديل أو لا يمكن تنفيذه بسهولة.
  • تعطّل الخدمة: ثمة عطل جزئي في نظام إنتاج أو خدمة و/أو لا يعمل على النحو المتوقّع. هناك حل بديل.
  • معلومات الخدمة: هناك عطل في نظام الإنتاج أو الخدمة جزئيًا و/أو لا يعمل على النحو المتوقّع. بشكل عام، لا تزال الخدمة متوفّرة، وتأثيرها بسيط، كما يؤثّر في عدد قليل من المستخدمين.
  • متوفّرة: تعمل الخدمة بشكل كامل وتعمل على النحو المتوقّع.

هل لوحة المعلومات في الوقت الفعلي؟

تهدف لوحة البيانات الخاصة بالحالة العلنية في "خرائط Google" إلى توفير حالة في الوقت الفعلي تقريبًا للمنتجات المتاحة للجمهور العام والتي تشملها اتفاقية مستوى الخدمة في "منصة خرائط Google". يتم التحقّق أولاً من جميع الحوادث قبل نشرها، لذلك قد يحدث تأخير بسيط منذ وقت رصدها للمرة الأولى. وبالتالي، يجب عدم استخدام لوحة البيانات لأغراض تتبع وقت التشغيل.

هل يمكنني استخدام لوحة البيانات لمراقبة مدة تشغيل "منصة خرائط Google"؟

إنّ لوحة البيانات الخاصة بالحالة العلنية للخرائط غير مخصّصة لمراقبة حالة خدمات "منصة Google للتسويق" استنادًا إلى اتفاقية مستوى خدمة "منصة Google للتسويق" لأنّ فترات انقطاع الخدمة المعروضة في لوحة البيانات قد لا تعكس "وقت الاستراحة" الفعلي (كما هو محدَّد في اتفاقية مستوى الخدمة) لمشروعك، خاصةً بالنسبة إلى الحوادث الأقل خطورة. بالإضافة إلى ذلك، قد تشمل المدد المعروضة وقتًا إضافيًا بعد التخفيف من حدة المشكلة لتأكيد الإصلاح بالكامل.

لتتبُّع استخدام واجهة برمجة التطبيقات وإنشاء لوحات بيانات وإنشاء تنبيهات، يُرجى الانتقال إلى مراقبة "منصة خرائط Google".

ماذا أفعل إذا لم يظهر حادث لي في لوحة البيانات؟

لا يتأثر بعض العملاء والمشروعات بكل حادث. لا تظهر في لوحة البيانات سوى الحوادث الواسعة والخطيرة. وإذا واجهت مشكلة غير مدرَجة في لوحة البيانات، يُرجى التواصل مع فريق الدعم .

أين يمكنني العثور على معلومات حول حالات انقطاع الخدمة وانقطاع الخدمة السابقة؟

صفحة السجلّ في لوحة بيانات الحالة العامة في "خرائط Google" هي مستودع يعرض حالات انقطاع الخدمة وحالات انقطاع الخدمة في آخر 365 يومًا. انقر على الحادثة لمراجعة المشاركات المتعلقة بالحادث أثناء وقوعه، بالإضافة إلى أي تقارير حوادث ينشرها فريق الدعم.

مَن يمكنه تعديل لوحة البيانات؟

يراقب فريق دعم "منصة خرائط Google" العالمي حالة الخدمات باستخدام أنواع مختلفة من الإشارات ويعدّل لوحة البيانات في حال حدوث مشكلة واسعة النطاق. وينشرون أيضًا، إذا لزم الأمر، تقريرًا مفصلاً عن تحليل بعد حل الحادثة.

ما الفرق بين "حادث" و "انقطاع الخدمة"؟

على الرغم من أنّ هذه المصطلحات غالبًا ما تستخدم بالتبادل، إلا أنّ لوحة البيانات العامة للحالة العامة في "خرائط Google" واتصالاتنا الخارجية تستخدمان مصطلح "حادث" للإشارة إلى أي فترة ينخفض فيها مستوى الخدمة و"انقطاع الخدمة" للإشارة فقط إلى حالات الضعف الأكثر خطورة، والتي تكون فيها الخدمة متوقّفة إلى حدّ يؤدي إلى جعل تجربة العملاء عديم الفائدة.