監控

效能最佳化的第一步是辨識關鍵指標,這類指標通常與延遲時間和處理量有關。我們新增了用於擷取及追蹤這些指標的監控功能,會曝露應用程式中的弱點。透過指標,您可以進行最佳化來改善成效指標。

此外,許多監控工具可讓您為指標設定快訊,以便在達到特定門檻時收到通知。舉例來說,您可以設定快訊,在失敗的要求百分比增加超過正常水準的 x% 時通知您。監控工具可協助您找出正常效能的狀況,並找出延遲時間、錯誤數量和其他重要指標的異常高峰。在重要業務時間範圍內,或新程式碼推送至實際工作環境後,監控這些指標的能力特別重要。

找出延遲時間指標

請務必讓 UI 盡可能回應使用者的需求,同時瞭解使用者期待行動應用程式擁有更高的標準。您也應該為後端服務測量及追蹤延遲時間,尤其是在未勾選的情況下,可能會導致處理量問題。

建議追蹤的指標如下:

  • 要求時間長度
  • 要求持續時間子系統精細程度 (例如 API 呼叫)
  • 工作時間長度

辨別處理量指標

處理量可用來評估在一定時間內提供的要求總數。處理量可能受到子系統延遲時間的影響,因此您可能需要最佳化延遲時間,才能改善總處理量。

建議您追蹤下列指標:

  • 每秒查詢次數
  • 每秒傳輸的資料大小
  • 每秒 I/O 作業數
  • 資源使用率,例如 CPU 或記憶體用量
  • 處理待處理工作的大小,例如 Pub/Sub 或執行緒數量

不只是平均值

評估效能的一個常見錯誤,就是觀察平均值 (平均) 情況。雖然這很實用,但無法深入分析延遲時間的分佈情形。更好的追蹤指標是效能百分位數,例如,指標的第 50/75/90/99 個百分位數。

一般來說,最佳化程序可透過兩個步驟完成。首先,最佳化完成第 90 個百分位數的延遲時間接著請思考第 99 個百分位數 (也稱為尾延遲),也就是需要較長時間才能完成的一小部分要求。

執行伺服器端監控,取得詳細結果

追蹤指標時,通常建議採用伺服器端剖析。伺服器端通常更容易檢測、可存取更精細的資料,並較不會因連線問題造成的衝擊。

端對端監控瀏覽器監控功能

瀏覽器剖析功能可提供額外的使用者體驗深入分析。這項功能可以顯示哪些頁面有速度緩慢的要求,接著可與伺服器端監控建立關聯,以進行進一步分析。

Google Analytics (分析)網頁時間報表中,提供立即可用的頁面載入時間監控功能。這提供了幾種實用的檢視畫面,方便您瞭解網站上的使用者體驗,特別是:

  • 網頁載入時間
  • 重新導向載入時間
  • 伺服器回應時間

雲端監控

有許多工具可用來擷取及監控應用程式效能指標。舉例來說,您可以使用 Google Cloud Logging 將成效指標記錄到 Google Cloud 專案,然後在 Google Cloud Monitoring 中設定資訊主頁,監控和區隔記錄的指標。

請參閱 Logging 指南,取得從 Python 用戶端程式庫中自訂攔截器記錄 Google Cloud Logging 的範例。在 Google Cloud 中取得資料後,您可以在記錄資料之上建立指標,透過 Google Cloud Monitoring 掌握應用程式情況。請按照使用者定義的記錄指標指南操作,使用傳送至 Google Cloud Logging 的記錄檔建立指標。

或者,您可以使用 Monitoring 用戶端程式庫定義程式碼中的指標,並將指標直接傳送到 Monitoring (與記錄分開)。

記錄指標範例

假設您要監控 is_fault 值,以便進一步瞭解應用程式中的錯誤率。您可以將 is_fault 值從記錄檔擷取到新的計數器指標 ErrorCount

指標設定

指標中的篩選器和標籤

在 Cloud Logging 中,標籤功能可讓您根據記錄中的其他資料,將指標分門別類。您可以為傳送至 Cloud Logging 的 method 欄位設定標籤,以便查看 Google Ads API 方法如何中斷錯誤計數。

設定 ErrorCount 指標和 Method 標籤後,您就可以在 Monitoring 資訊主頁中建立新圖表,以監控依 Method 分組的 ErrorCount

ErrorCount 資訊主頁

快訊

在 Cloud Monitoring 和其他工具中,您可以設定快訊政策,指定指標觸發快訊的時機和方式。如需設定 Cloud Monitoring 快訊的操作說明,請參閱快訊指南的說明。