การจัดการเหตุการณ์ของ Google Maps Platform

วงจรของเหตุการณ์

Google Maps Platform ปฏิบัติตามเฟรมเวิร์กการจัดการเหตุการณ์ของ Google Cloud Platform

เมื่อเกิดการหยุดชะงักของบริการหรือบริการลดลง ทีมวิศวกรผลิตภัณฑ์และทีมสนับสนุนของ Google Maps Platform จะทำงานร่วมกันเพื่อแก้ไขปัญหาและแจ้งให้คุณทราบ

lifecycle

การตรวจจับ

Google ใช้การตรวจสอบภายในและกล่องดำเพื่อตรวจจับเหตุการณ์และทริกเกอร์การแจ้งเตือนให้วิศวกรของเราตรวจสอบ ดูข้อมูลเพิ่มเติมได้ที่บทที่ 6 ของหนังสือวิศวกรรมความเสถียรสำหรับเว็บไซต์

หากคุณตรวจพบเหตุการณ์ที่ยังไม่ได้รายงานในเครื่องมือติดตามปัญหา ให้ไปที่หน้าสร้างเคสขอรับความช่วยเหลือสำหรับ Google Maps Platform (ใน Google Cloud Console) และสร้างเคสขอรับความช่วยเหลือใหม่

การตอบกลับเบื้องต้น

เมื่อ Google ตรวจพบเหตุการณ์ ทีมสนับสนุนจะสื่อสารกับคุณ การแจ้งเตือนครั้งแรกเกี่ยวกับเหตุการณ์ มักจะไม่เกิดขึ้นบ่อยนัก โดยมักจะพูดถึงเฉพาะผลิตภัณฑ์ที่เป็นปัญหาพร้อมกับอาการหลักๆ เท่านั้น เนื่องจากเราให้ความสำคัญกับการแจ้งเตือนที่รวดเร็วมากกว่ารายละเอียด เมื่อเราเรียนรู้แล้ว เราจะให้รายละเอียดเพิ่มเติมในการอัปเดตครั้งต่อๆ ไป

การตอบกลับ

ช่องทางการสื่อสารเหตุการณ์

ทีมสนับสนุนของ Google Maps Platform มีช่องทางการสื่อสารเกี่ยวกับเหตุการณ์ต่างๆ โดยขึ้นอยู่กับขอบเขตและความรุนแรงของปัญหา เพื่อให้ข้อมูลในปริมาณที่เหมาะสม

แดชบอร์ดสถานะสาธารณะของ Maps เป็นสถานที่แรกในการตรวจสอบเมื่อพบปัญหาที่ส่งผลกระทบต่อคุณ หน้าแดชบอร์ดจะแสดงเหตุการณ์ที่ส่งผลกระทบต่อลูกค้าจำนวนมาก ดังนั้นหากคุณเห็นเหตุการณ์ที่ระบุว่าน่าจะเกี่ยวข้องกับปัญหา หน้าแดชบอร์ดสถานะจะทำเครื่องหมายเหตุการณ์ต่างๆ ว่าเป็นการหยุดทำงานของบริการ การหยุดชะงัก หรือข้อมูลเพื่อระบุความรุนแรง

กลุ่มการแจ้งเตือนของ Google Maps Platform เป็นกลุ่ม Google แบบสาธารณะที่มีการรายงานการหยุดชะงักในวงกว้างทั้งหมด นอกเหนือจากการอัปเดตทางเทคนิคอื่นๆ เกี่ยวกับ Google Maps Platform API สมาชิกทุกคนในกลุ่มจะได้รับการแจ้งเตือนทางอีเมลเมื่อตรวจพบการหยุดทำงานเริ่มต้นพร้อมด้วยการอัปเดตครั้งต่อๆ ไปจนกว่าปัญหาจะได้รับการแก้ไข

การ์ดสถานะ Maps Platform คือข้อความให้ข้อมูลที่จะแสดงเสมอในส่วนการสนับสนุน Maps ของ Cloud Console ซึ่งแสดงสถานะปัจจุบันของ Maps Platform API และบริการ เมื่อมีเหตุการณ์ที่ทำงานอยู่ จะมีข้อความระบุผลิตภัณฑ์ที่ได้รับผลกระทบและมีลิงก์ไปยังแดชบอร์ดสถานะสาธารณะของ Maps ซึ่งคุณสามารถดูเหตุการณ์ที่กำลังเกิดขึ้นได้

การหยุดทำงาน

เครื่องมือติดตามปัญหา มีรายการอ้างอิงของเหตุการณ์ที่ทราบทั้งหมด คุณดูเหตุการณ์ที่เปิดอยู่ ติดตามความคืบหน้าด้วยการติดตามเหตุการณ์ดังกล่าว และเพิ่มความคิดเห็นเพื่อช่วยทีมของเราตรวจสอบเหตุการณ์ได้ คุณยังจะเห็นลิงก์ไปยังเครื่องมือติดตามปัญหาในเอกสารประกอบการสนับสนุนของ Google Maps Platform ด้วย

ระบบจะใช้ประวัติการช่วยเหลือในกรณีที่ปัญหาอาจแยกออกเป็นโปรเจ็กต์หรือส่งผลต่อลูกค้าจำนวนจำกัด หากไม่ได้ประกาศเหตุการณ์ใดๆ ไว้ แต่คุณยังคงพบปัญหาอยู่ ให้ไปที่หน้าสร้างเคสขอรับความช่วยเหลือสำหรับ Google Maps Platform (ใน Cloud Console) และสร้างเคสขอรับความช่วยเหลือใหม่

การตรวจสอบ

ทีมวิศวกรของผลิตภัณฑ์จะรับผิดชอบการตรวจสอบสาเหตุของปัญหาที่เกิดขึ้น การจัดการเหตุการณ์มักดำเนินการโดยวิศวกรความเสถียรสำหรับเว็บไซต์ แต่อาจดำเนินการโดยวิศวกรซอฟต์แวร์หรือรายอื่นๆ ทั้งนี้ขึ้นอยู่กับสถานการณ์และผลิตภัณฑ์ ดูข้อมูลเพิ่มเติมได้ที่บทที่ 12 ของหนังสือวิศวกรรมความเสถียรสำหรับเว็บไซต์

การลด/แก้ไข

ระบบจะถือว่าปัญหาได้รับการแก้ไขแล้วก็ต่อเมื่อมีการเปลี่ยนแปลงที่ Google มั่นใจว่าจะสิ้นสุดผลกระทบอย่างไม่มีกำหนด เช่น การแก้ไขอาจย้อนกลับการเปลี่ยนแปลงที่ทริกเกอร์เหตุการณ์

ขณะที่เหตุการณ์กำลังดำเนินการอยู่ ทีมสนับสนุนและผลิตภัณฑ์จะพยายามบรรเทาปัญหา การบรรเทาปัญหาเกิดขึ้นเมื่อผลกระทบหรือขอบเขตของปัญหาลดลงได้ เช่น โดยการมอบทรัพยากรเพิ่มเติมชั่วคราวให้แก่บริการที่ประสบปัญหาภาระงานหนักเกินไป

หากไม่พบการบรรเทาปัญหา ทีมสนับสนุนจะค้นหาและแจ้งวิธีแก้ปัญหาให้ทราบทุกครั้งที่เป็นไปได้ วิธีแก้ปัญหาเบื้องต้นคือขั้นตอนที่คุณทำเพื่อแก้ไขปัญหาที่จำเป็นได้แม้จะเกิดเหตุการณ์นั้นขึ้น วิธีแก้ปัญหาเฉพาะหน้าคือการใช้การตั้งค่าที่แตกต่างกันสำหรับการเรียก API เพื่อหลีกเลี่ยงเส้นทางโค้ดที่เป็นปัญหา

คำอธิบายเพิ่มเติม

ขณะที่เหตุการณ์ดำเนินอยู่ ทีมสนับสนุนจะคอยอัปเดตข้อมูลอย่างสม่ำเสมอ โดยปกติแล้วการอัปเดตต่อไปนี้

  • ข้อมูลเพิ่มเติมเกี่ยวกับเหตุการณ์ เช่น ข้อความแสดงข้อผิดพลาด ฟีเจอร์ที่ได้รับผลกระทบ และความแพร่หลายของเหตุการณ์
  • ความคืบหน้าของการบรรเทาปัญหา รวมถึงวิธีแก้ปัญหาเฉพาะหน้า
  • ลำดับเวลาของการสื่อสารที่ปรับให้เหมาะกับเหตุการณ์
  • สถานะที่เปลี่ยนไป เช่น เมื่อมีการแก้ไขเหตุการณ์

การทบทวนการทำงานร่วมกัน

เหตุการณ์ทั้งหมดจะส่งผลให้มีการวิเคราะห์ภายใน (หลังเหตุการณ์) เพื่อให้เข้าใจเหตุการณ์อย่างถ่องแท้ และระบุการปรับปรุงความน่าเชื่อถือที่ Google จะทำได้ จากนั้นระบบจะติดตามและนำการปรับปรุงเหล่านี้ไปใช้ ดูข้อมูลเพิ่มเติมเกี่ยวกับการทบทวนการทำงานร่วมกันของ Google ได้ที่บทที่ 15 ของหนังสือวิศวกรรมความเสถียรสำหรับเว็บไซต์

รายงานเหตุการณ์

เมื่อเหตุการณ์มีผลกระทบในวงกว้างและร้ายแรง Google จะแสดงรายงานเหตุการณ์ที่กำหนดขอบเขตของอาการ ผลกระทบ สาเหตุที่แท้จริง การแก้ไข และการป้องกันเหตุการณ์ในอนาคต เช่นเดียวกับการทบทวนการทำงานร่วมกัน เราให้ความสำคัญเป็นพิเศษกับขั้นตอนที่ดำเนินการเพื่อเรียนรู้จากปัญหาและปรับปรุงความน่าเชื่อถือ เป้าหมายของ Google ในการเขียนและประกาศการให้ความช่วยเหลือแบบจำนองคือ ความโปร่งใสและแสดงถึงความมุ่งมั่นในการสร้างบริการที่เสถียรสำหรับลูกค้าของเรา

คำถามที่พบบ่อย

ฉันต้องการรับการแจ้งเตือนเมื่อมีการหยุดทำงานอย่างต่อเนื่อง ควรทำอย่างไร

  • เข้าร่วมกลุ่มการแจ้งเตือนของ Google Maps Platform เพื่อรับการแจ้งเตือนเกี่ยวกับปัญหาที่กำลังเกิดขึ้นและติดตามความคืบหน้าของเหตุการณ์แบบเรียลไทม์ กลุ่มนี้จะช่วยให้คุณติดตามประกาศล่าสุดเกี่ยวกับผลิตภัณฑ์และแพลตฟอร์มด้วย
  • ใช้ลิงก์ฟีด RSS หรือประวัติ JSON ที่ด้านล่างของ หน้าแดชบอร์ดสถานะสาธารณะของ Maps เพื่อดูฟีดของเหตุการณ์ปัจจุบันและที่ผ่านมา ทุกโพสต์ในหน้าแดชบอร์ดจะเรียกใช้โพสต์ไปยังฟีด โพสต์แต่ละรายการในฟีดจะมีข้อความและการอัปเดตทั้งหมดที่เกี่ยวข้องกับเหตุการณ์ในหน้าแดชบอร์ดที่เกี่ยวข้องเพื่อให้คุณรับข้อมูลอัปเดต วิธีนี้จะช่วยให้คุณไม่ต้องสืบค้นประวัติฟีดเพื่อปะติดปะต่อว่าสิ่งต่างๆ ดำเนินไปอย่างไร ฟีด RSS ได้รับการเผยแพร่ในรูปแบบ XML ส่วนขยายเบราว์เซอร์ เช่น RSS Subscription Extension (โดย Google) ช่วยให้คุณสามารถดูตัวอย่างเนื้อหาฟีดและสมัครผ่านโปรแกรมอ่าน RSS ที่คุณชื่นชอบ ประวัติ JSON คือฟีดเว็บ JSON ของเหตุการณ์ที่ผ่านมา ไลบรารีซอฟต์แวร์และเว็บเฟรมเวิร์กที่หลากหลายซึ่ง รองรับการเผยแพร่เนื้อหาผ่านฟีด JSON

ฉันจะดูข้อมูลสถานะประเภทใดได้บ้างในหน้าแรกของหน้าแดชบอร์ด

แดชบอร์ดสถานะสาธารณะของ Google Maps ให้ข้อมูลเกี่ยวกับ API และบริการที่เป็นส่วนหนึ่งของ Google Maps Platform หากมีเหตุการณ์ที่ทำงานอยู่ จะมีการโพสต์ข้อมูลเกี่ยวกับ API และบริการที่เจาะจงแต่ละรายการภายใน Google Maps Platform ที่นี่ ตัวบ่งชี้สถานะจะแสดงอยู่เสมอ ซึ่งจะแสดงประสิทธิภาพโดยรวมของ API และบริการแต่ละรายการจากข้อใดข้อหนึ่งต่อไปนี้

  • บริการหยุดทำงาน: ระบบหรือบริการที่ใช้งานจริงหยุดทำงาน วิธีแก้ปัญหาเบื้องต้นไม่พร้อมใช้งานหรือใช้งานได้ยาก
  • บริการขัดข้อง: ระบบหรือบริการที่ใช้งานจริงมีความเสียหายบางส่วน และ/หรือไม่ทำงานตามที่คาดไว้ มีวิธีแก้ปัญหาเฉพาะหน้าแล้ว
  • ข้อมูลบริการ: ระบบหรือบริการที่ใช้งานจริงมีความเสียหายบางส่วน และ/หรือไม่ทำงานตามที่คาดไว้ โดยปกติแล้ว บริการนี้ยังใช้งานได้อยู่ มีผลกระทบเล็กน้อย และส่งผลต่อผู้ใช้จำนวนน้อย
  • พร้อมใช้งาน: บริการทำงานได้อย่างสมบูรณ์และทำงานตามที่คาดไว้

หน้าแดชบอร์ดเป็นแบบเรียลไทม์หรือไม่

แดชบอร์ดสถานะสาธารณะของ Maps มีไว้เพื่อให้สถานะที่ใกล้เคียงกับเรียลไทม์ของผลิตภัณฑ์ซึ่งมีให้บริการโดยทั่วไปและอยู่ภายใต้ SLA ของ Google Maps Platform เหตุการณ์ทั้งหมดจะได้รับการยืนยันก่อนโพสต์ จึงอาจเกิดความล่าช้าเล็กน้อยจากเวลาที่ตรวจพบครั้งแรก ดังนั้น จึงไม่ควรใช้แดชบอร์ดเพื่อวัตถุประสงค์ด้านการติดตามระยะเวลาทำงาน

ฉันสามารถใช้แดชบอร์ดเพื่อตรวจสอบระยะเวลาทำงานของ Google Maps Platform ได้ไหม

แดชบอร์ดสถานะสาธารณะของ Maps ไม่ได้มีไว้เพื่อตรวจสอบสถานะของบริการ GMP ตาม SLA ของ GMP เนื่องจากระยะเวลาของการหยุดทำงานที่แสดงในแดชบอร์ดอาจไม่ได้แสดงถึง "ช่วงพักการใช้งาน" จริง (ตามที่ให้คำจำกัดความไว้ใน SLA) สำหรับโปรเจ็กต์ของคุณ โดยเฉพาะเหตุการณ์ที่มีความรุนแรงระดับต่ำกว่า นอกจากนี้ ระยะเวลาที่แสดงอาจรวมถึงเวลาเพิ่มเติมหลังจากที่มีการบรรเทาปัญหาเพื่อยืนยันการแก้ไขอย่างสมบูรณ์

หากต้องการตรวจสอบการใช้งาน API, สร้างแดชบอร์ด และสร้างการแจ้งเตือน โปรดไปที่ การตรวจสอบ Google Maps Platform

ควรทำอย่างไรหากไม่เห็นเหตุการณ์ในหน้าแดชบอร์ด

ลูกค้าและโปรเจ็กต์บางส่วนจะไม่ได้รับผลกระทบจากทุกเหตุการณ์ หน้าแดชบอร์ดจะแสดงเฉพาะเหตุการณ์แบบกว้างและรุนแรงเท่านั้น หากพบปัญหาที่ไม่ได้ระบุไว้ในหน้าแดชบอร์ด โปรดติดต่อฝ่ายสนับสนุน

ฉันจะดูข้อมูลเกี่ยวกับการหยุดชะงักและการหยุดให้บริการในอดีตได้จากที่ใด

หน้า ประวัติในแดชบอร์ดสถานะสาธารณะของ Maps คือพื้นที่เก็บข้อมูลของการหยุดชะงักและการหยุดทำงานในช่วง 365 วันที่ผ่านมา คลิกเหตุการณ์เพื่อตรวจสอบโพสต์เกี่ยวกับเหตุการณ์ที่เกิดขึ้นในขณะนั้น รวมถึงรายงานเหตุการณ์ที่เผยแพร่โดยทีมสนับสนุน

ใครอัปเดตหน้าแดชบอร์ด

ทีมสนับสนุนแพลตฟอร์ม Google Maps ทั่วโลกจะตรวจสอบสถานะของบริการโดยใช้สัญญาณหลากหลายประเภทและอัปเดตหน้าแดชบอร์ดในกรณีที่เกิดปัญหาในวงกว้าง นอกจากนี้ หากจำเป็น ทีมจะโพสต์รายงานการวิเคราะห์โดยละเอียดหลังจากที่เหตุการณ์ได้รับการแก้ไขแล้วด้วย

"เหตุการณ์" และ "การหยุดทำงาน" แตกต่างกันอย่างไร

แม้ว่าคำเหล่านี้มักใช้แทนกัน แต่แดชบอร์ดสถานะสาธารณะของ Maps และการสื่อสารภายนอกของเราใช้คำว่า "เหตุการณ์" เพื่อหมายถึงช่วงเวลาของบริการที่ลดลงและ "การหยุดทำงาน" เพื่อหมายถึงความบกพร่องที่ร้ายแรงที่สุดเท่านั้น โดยที่บริการไม่ทำงานในขอบเขตที่ทำให้ลูกค้าได้รับประสบการณ์ที่ไร้ประโยชน์