Quản lý sự cố trên nền tảng Google Maps

Vòng đời của sự cố

Nền tảng Google Maps tuân thủ Khung quản lý sự cố của Google Cloud Platform.

Khi tình trạng ngừng hoạt động hoặc chấm dứt hoạt động dịch vụ, nhóm kỹ thuật sản phẩm và nhóm Hỗ trợ Nền tảng Google Maps sẽ làm việc cùng nhau để giải quyết sự cố và thông báo cho bạn.

vòng đời

Phát hiện

Google sử dụng chức năng giám sát hộp đen và nội bộ để phát hiện các sự cố và kích hoạt cảnh báo cho các kỹ sư của chúng tôi để điều tra. Để biết thêm thông tin, hãy xem Chương 6 trong sách Kỹ thuật độ tin cậy của trang web.

Nếu bạn phát hiện một sự cố chưa được báo cáo trong Công cụ theo dõi lỗi, hãy chuyển đến trang Hỗ trợ nền tảng của Google Maps (trong Google Cloud Console) rồi tạo một yêu cầu hỗ trợ mới.

Phản hồi ban đầu

Khi Google phát hiện thấy sự cố, Nhóm hỗ trợ sẽ dẫn dắt giao tiếp với bạn. Thông báo ban đầu về một sự cố thường khá thưa thớt, thường chỉ đề cập đến sản phẩm được đề cập cùng với các triệu chứng chính. Lý do là chúng tôi ưu tiên thông báo nhanh hơn là chi tiết. Khi tìm hiểu thêm, chúng tôi sẽ cung cấp thêm thông tin chi tiết trong các bản cập nhật tiếp theo.

phản hồi

Kênh liên lạc về sự cố

Để cung cấp lượng thông tin thích hợp, Nhóm hỗ trợ Nền tảng Google Maps cung cấp nhiều kênh liên lạc về sự cố, tùy thuộc vào phạm vi và mức độ nghiêm trọng của một vấn đề:

Trang tổng quan về trạng thái công khai của Maps là nơi đầu tiên bạn nên kiểm tra khi phát hiện một vấn đề đang ảnh hưởng đến mình. Trang tổng quan này cho thấy các sự cố ảnh hưởng đến nhiều khách hàng. Vì vậy, nếu bạn thấy sự cố được liệt kê, thì sự cố đó có thể liên quan đến vấn đề của bạn. Để cho biết mức độ nghiêm trọng, trang tổng quan về trạng thái sẽ đánh dấu các sự cố là ngừng hoạt động, gián đoạn hoặc thông tin.

Nhóm thông báo về Nền tảng Google Maps là một nhóm Google công khai, trong đó tất cả các trường hợp ngừng hoạt động trên toàn diện đều được báo cáo, ngoài các thông tin cập nhật kỹ thuật khác về API của Nền tảng Google Maps. Tất cả thành viên trong nhóm sẽ nhận được thông báo qua email khi phát hiện tình trạng ngừng hoạt động ban đầu kèm theo thông tin cập nhật tiếp theo cho đến khi vấn đề được giải quyết.

Thẻ trạng thái của Maps Platform là một thông báo luôn xuất hiện trong phần Maps Support (Hỗ trợ Maps) của Cloud Console, cho thấy trạng thái hiện tại của các API và dịch vụ trên Maps Platform. Khi có sự cố đang diễn ra, sẽ có thông báo xác định sản phẩm bị ảnh hưởng và bao gồm đường liên kết đến Trang tổng quan về trạng thái công khai của Maps nơi bạn có thể xem các sự cố đang xảy ra.

ngừng hoạt động

Công cụ theo dõi lỗi chứa danh sách tham chiếu về tất cả sự cố đã biết. Bạn có thể xem các sự cố đang mở, theo dõi tiến độ của sự cố bằng cách đăng ký các sự cố đó và thêm nhận xét để giúp nhóm của chúng tôi điều tra. Bạn cũng có thể tìm thấy đường liên kết đến Công cụ theo dõi lỗi trong tài liệu hỗ trợ về Nền tảng Google Maps.

Các trường hợp hỗ trợ sẽ được dùng nếu vấn đề có thể bị tách biệt với(các) dự án hoặc ảnh hưởng đến một số lượng khách hàng có giới hạn. Nếu bạn chưa khai báo sự cố nhưng vẫn gặp phải sự cố, hãy truy cập trang Tạo yêu cầu hỗ trợ của Nền tảng Google Maps (trong Cloud Console) và tạo một yêu cầu hỗ trợ mới.

Điều tra

Nhóm kỹ sư sản phẩm chịu trách nhiệm điều tra nguyên nhân gốc rễ của sự cố. Việc quản lý sự cố thường do các Kỹ sư quản lý độ tin cậy của trang web thực hiện, nhưng có thể do các kỹ sư phần mềm hoặc những người khác thực hiện, tuỳ thuộc vào tình huống và sản phẩm. Để biết thêm thông tin, hãy xem Chương 12 của Sách kỹ thuật về độ tin cậy của trang web.

Giảm thiểu/khắc phục

Một vấn đề chỉ được coi là đã khắc phục khi những thay đổi đó được cho rằng Google chắc chắn sẽ chấm dứt tác động đó vô thời hạn. Ví dụ: bản sửa lỗi có thể khôi phục một thay đổi đã kích hoạt một sự cố.

Trong khi sự cố đang diễn ra, nhóm Hỗ trợ và Sản phẩm sẽ cố gắng giảm thiểu vấn đề. Việc giảm thiểu xảy ra khi có thể giảm tác động hoặc phạm vi của một vấn đề, ví dụ: tạm thời cung cấp thêm tài nguyên cho một dịch vụ bị quá tải.

Nếu không tìm thấy biện pháp giảm thiểu nào, thì Nhóm hỗ trợ sẽ tìm và thông báo về các giải pháp. Giải pháp là các bước mà bạn có thể thực hiện để giải quyết nhu cầu cơ bản bất kể sự cố. Một giải pháp có thể là sử dụng các chế độ cài đặt khác nhau cho lệnh gọi API để tránh đường dẫn mã có vấn đề.

Tiếp nối

Trong khi sự cố đang diễn ra, Nhóm hỗ trợ sẽ thường xuyên cập nhật. Nội dung cập nhật thường cung cấp:

  • Thông tin khác về sự cố, chẳng hạn như các thông báo lỗi, tính năng bị ảnh hưởng và mức độ phổ biến của sự cố.
  • Tiến trình giảm thiểu, bao gồm cả mọi giải pháp.
  • Tiến trình giao tiếp, được điều chỉnh cho phù hợp với sự cố.
  • Các thay đổi về trạng thái, chẳng hạn như khi một sự cố được khắc phục.

Sau khi khám phá

Tất cả các sự cố đều dẫn đến một bản phân tích nội bộ sau khi xảy ra sự cố để hiểu rõ về sự cố và để xác định những điểm cải thiện về độ tin cậy mà Google có thể thực hiện. Sau đó, những điểm cải tiến này sẽ được theo dõi và triển khai. Để biết thêm thông tin về quy trình hậu tố tại Google, hãy xem Chương 15 của Sách kỹ thuật về độ tin cậy của trang web.

Báo cáo sự cố

Khi sự cố có tác động rất rộng và nghiêm trọng, Google sẽ cung cấp các báo cáo sự cố liệt kê các triệu chứng, tác động, nguyên nhân gốc rễ, khắc phục và ngăn chặn sự cố trong tương lai. Tương tự như sau khi khám phá, chúng tôi đặc biệt chú ý đến các bước cần thực hiện để tìm hiểu vấn đề và cải thiện độ tin cậy. Mục tiêu của Google trong việc viết và phát hành hậu tố là minh bạch và thể hiện cam kết của chúng tôi trong việc xây dựng các dịch vụ ổn định cho khách hàng.

Câu hỏi thường gặp

Tôi muốn được thông báo khi có sự cố ngừng hoạt động. Tôi cần làm gì?

  • Hãy tham gia nhóm Thông báo về nền tảng của Google Maps để nhận thông báo về các vấn đề đang diễn ra và theo dõi tiến trình của sự cố theo thời gian thực. Nhóm này cũng sẽ giúp bạn nắm bắt các thông báo về sản phẩm và nền tảng.
  • Hãy sử dụng các đường liên kết đến Nguồn cấp dữ liệu RSS hoặc Lịch sử JSON ở cuối Trang tổng quan về trạng thái công khai của Maps để xem nguồn cấp dữ liệu về các sự cố hiện tại và trước đây. Mọi bài đăng lên Trang tổng quan sẽ kích hoạt bài đăng lên nguồn cấp dữ liệu. Để bạn luôn nắm được thông tin mới nhất, mỗi bài đăng trên nguồn cấp dữ liệu đó sẽ bao gồm tất cả thông báo và nội dung cập nhật liên quan đến sự kiện tương ứng trên Trang tổng quan. Nhờ đó, bạn sẽ không cần phải tìm hiểu lịch sử nguồn cấp dữ liệu để kết nối mọi thứ với nhau. Nguồn cấp dữ liệu RSS được xuất bản ở định dạng XML. Những tiện ích về trình duyệt, chẳng hạn như Phần mở rộng về gói thuê bao RSS (của Google), cho phép bạn xem trước nội dung trên nguồn cấp dữ liệu và đăng ký thông qua trình đọc RSS mà bạn yêu thích. Lịch sử JSON là Nguồn cấp dữ liệu web JSON về các sự cố trước đây. Phạm vi thư viện phần mềm và khung web hỗ trợ phân phối nội dung qua Nguồn cấp dữ liệu JSON.

Tôi có thể tìm thấy loại thông tin trạng thái nào trên trang chủ trang tổng quan?

Trang tổng quan về trạng thái công khai của Google Maps cung cấp thông tin về các API và dịch vụ thuộc Nền tảng Google Maps. Nếu có một sự cố đang xảy ra, thông tin sẽ được đăng tại đây cho từng API và dịch vụ cụ thể trong Nền tảng Google Maps. Các chỉ báo trạng thái luôn hiển thị, đại diện cho trạng thái tổng thể của từng API và dịch vụ, từ một trong những thông tin sau:

  • Ngừng dịch vụ: Hệ thống sản xuất hoặc dịch vụ bị gián đoạn. Giải pháp không khả dụng hoặc không dễ triển khai.
  • Gián đoạn dịch vụ: Hệ thống sản xuất hoặc dịch vụ bị suy giảm một phần và/hoặc không hoạt động như mong đợi. Giải pháp tồn tại.
  • Thông tin dịch vụ: Một hệ thống hoặc dịch vụ sản xuất bị suy giảm một phần và/hoặc không hoạt động như mong đợi. Nhìn chung, dịch vụ này vẫn hoạt động, tác động nhỏ và ảnh hưởng đến một số ít người dùng.
  • Có sẵn: Dịch vụ có đầy đủ chức năng và hoạt động như mong đợi.

Trang tổng quan này có theo thời gian thực không?

Trang tổng quan về trạng thái công khai của Maps nhằm cung cấp trạng thái gần như theo thời gian thực của những sản phẩm thường được cung cấp và bao gồm trong SLA của Google Maps. Mọi sự cố đều được xác minh trước khi đăng. Vì vậy, có thể sẽ hơi chậm trễ so với thời điểm phát hiện lần đầu. Do đó, bạn không được sử dụng trang tổng quan cho mục đích theo dõi thời gian hoạt động.

Tôi có thể sử dụng trang tổng quan để theo dõi thời gian hoạt động của Nền tảng Google Maps không?

Trang tổng quan về trạng thái công khai của Maps không nhằm mục đích giám sát trạng thái của các dịch vụ GMP dựa trên SLA SLA, vì thời gian ngừng hoạt động hiển thị trên trang tổng quan này có thể không phản ánh "Thời gian ngừng hoạt động" thực tế (theo định nghĩa trong SLA) của dự án, đặc biệt là các sự cố nghiêm trọng thấp hơn. Ngoài ra, thời hạn hiển thị có thể bao gồm thêm thời gian sau khi vấn đề này được giảm thiểu để xác nhận toàn bộ thời gian khắc phục.

Để theo dõi mức sử dụng API, tạo trang tổng quan và tạo cảnh báo, hãy truy cập vào trang Giám sát nền tảng Google Maps.

Nếu tôi không thấy sự cố trên trang tổng quan thì sao?

Không phải mọi khách hàng và dự án đều bị ảnh hưởng bởi mỗi sự cố. Chỉ các sự cố rộng và nghiêm trọng mới được phản ánh trên trang tổng quan. Nếu bạn gặp phải một vấn đề không có trong trang tổng quan, hãy liên hệ với bộ phận hỗ trợ.

Tôi có thể tìm thông tin về các sự cố gián đoạn và sự cố ngừng dịch vụ trước đây ở đâu?

Trang Lịch sử trong Trang tổng quan trạng thái công khai của Maps là kho lưu trữ các tình trạng gián đoạn và ngừng hoạt động trong 365 ngày qua. Nhấp vào một sự cố để xem lại các bài đăng về sự cố đó trong lúc diễn ra sự cố, cũng như mọi báo cáo sự cố do Nhóm hỗ trợ xuất bản.

Ai cập nhật trang tổng quan?

Nhóm hỗ trợ Nền tảng Google Maps trên toàn cầu sẽ theo dõi trạng thái dịch vụ bằng nhiều loại tín hiệu và cập nhật trang tổng quan trong trường hợp xảy ra vấn đề trên diện rộng. Nếu cần, họ cũng sẽ đăng báo cáo phân tích chi tiết sau khi giải quyết xong sự cố.

"Sự cố" và "sự cố" là gì?

Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, Trang tổng quan về trạng thái công khai của Maps và kết nối từ bên ngoài của chúng tôi sử dụng "sự cố" để chỉ bất kỳ giai đoạn nào của dịch vụ bị giảm chất lượng và "sự cố" để chỉ sự suy giảm nghiêm trọng nhất, trong đó một dịch vụ không hoạt động ở mức độ mà nó hiển thị một cách hiệu quả cho khách hàng.