Monitoraggio

L'ottimizzazione del rendimento inizia con l'identificazione delle metriche chiave, in genere correlate a latenza e throughput. L'aggiunta del monitoraggio per acquisire e monitorare queste metriche espone i punti deboli dell'applicazione. Con le metriche, è possibile intraprendere l'ottimizzazione per migliorare le metriche sul rendimento.

Inoltre, molti strumenti di monitoraggio ti consentono di configurare avvisi per le metriche, in modo da ricevere una notifica quando viene raggiunta una determinata soglia. Ad esempio, puoi configurare un avviso per ricevere una notifica quando la percentuale di richieste non riuscite aumenta di oltre x% rispetto ai livelli normali. Gli strumenti di monitoraggio possono aiutarti a identificare l'aspetto del rendimento normale e a identificare picchi insoliti di latenza, quantità di errori e altre metriche chiave. La possibilità di monitorare queste metriche è particolarmente importante durante i periodi di tempo critici per l'attività o dopo che il nuovo codice è stato inviato alla produzione.

Identificare le metriche di latenza

Assicurati di mantenere l'interfaccia utente il più reattiva possibile, tenendo presente che gli utenti si aspettano standard ancora più elevati dalle app mobile. La latenza deve essere misurata e monitorata anche per i servizi di backend, in particolare perché, se non viene controllata, può causare problemi di throughput.

Le metriche suggerite da monitorare includono le seguenti:

  • Durata della richiesta
  • Durata della richiesta con granularità del sottosistema (ad es. chiamate API)
  • Durata job

Identificare le metriche di throughput

Il throughput è una misura del numero totale di richieste gestite in un determinato periodo di tempo. Il throughput può essere influenzato dalla latenza dei sottosistemi, quindi potrebbe essere necessario ottimizzare la latenza per migliorare il throughput.

Ecco alcune metriche suggerite da monitorare:

  • Query al secondo
  • Dimensione dei dati trasferiti al secondo
  • Numero di operazioni di I/O al secondo
  • Utilizzo delle risorse, ad esempio utilizzo di CPU o memoria utilizzata
  • Dimensione del backlog di elaborazione, ad esempio Pub/Sub o numero di thread

Non solo la media

Un errore comune nella misurazione del rendimento è considerare solo il caso medio (medio). Sebbene sia utile, non fornisce informazioni sulla distribuzione della latenza. Una metrica migliore da monitorare sono i percentili di rendimento, ad esempio il 50°, 75°, 90° e 99° percentile per una metrica.

In genere, l'ottimizzazione può essere eseguita in due passaggi. Innanzitutto, ottimizza la latenza del 90° percentile. Poi, considera il 99° percentile, noto anche come latenza di coda: la piccola parte di richieste che richiedono molto più tempo per essere completate.

Monitoraggio lato server per risultati dettagliati

In genere, è preferibile il profiling lato server per monitorare le metriche. In genere, il lato server è molto più facile da strumentare, consente l'accesso a dati più granulari ed è meno soggetto a perturbazioni dovute a problemi di connettività.

Monitoraggio del browser per la visibilità end-to-end

Il profiling del browser può fornire ulteriori informazioni sull'esperienza dell'utente finale. Può mostrare le pagine con richieste lente, che puoi quindi correlare al monitoraggio lato server per ulteriori analisi.

Google Analytics fornisce il monitoraggio predefinito dei tempi di caricamento delle pagine nel report sui tempi delle pagine. Questo fornisce diverse visualizzazioni utili per comprendere l'esperienza utente sul tuo sito, in particolare:

  • Tempi di caricamento delle pagine
  • Tempi di caricamento dei reindirizzamenti
  • Tempi di risposta del server

Monitoraggio nel cloud

Esistono molti strumenti che puoi utilizzare per acquisire e monitorare le metriche sul rendimento della tua applicazione. Ad esempio, puoi utilizzare Google Cloud Logging per registrare le metriche sul rendimento nel tuo progetto Google Cloud, quindi configurare le dashboard in Google Cloud Monitoring per monitorare e segmentare le metriche registrate.

Consulta la guida di Logging per un esempio di logging in Google Cloud Logging da un intercettore personalizzato nella libreria client Python. Con questi dati disponibili in Google Cloud, puoi creare metriche basate sui dati registrati per ottenere visibilità sulla tua applicazione tramite Google Cloud Monitoring. Segui la guida per le metriche basate su log definite dall'utente per creare metriche utilizzando i log inviati a Google Cloud Logging.

In alternativa, puoi utilizzare le librerie client di Monitoring per definire le metriche nel codice e inviarle direttamente a Monitoring, separatamente dai log.

Esempio di metriche basate su log

Supponiamo che tu voglia monitorare il valore is_fault per comprendere meglio le percentuali di errore nella tua applicazione. Puoi estrarre il valore is_fault dai log in una nuova metrica contatore, ErrorCount.

Configurazione delle metriche

Filtri ed etichette nelle metriche

In Cloud Logging, le etichette ti consentono di raggruppare le metriche in categorie in base ad altri dati nei log. Puoi configurare un'etichetta per il method campo inviato a Cloud Logging per esaminare la suddivisione del conteggio degli errori in base al metodo dell'API Google Ads.

Con la metrica ErrorCount e l'etichetta Method configurate, puoi creare un nuovo grafico in una dashboard di Monitoring per monitorare ErrorCount, raggruppato per Method.

Dashboard ErrorCount

Avvisi

In Cloud Monitoring e in altri strumenti è possibile configurare criteri di avviso che specificano quando e come gli avvisi devono essere attivati dalle metriche. Per istruzioni sulla configurazione degli avvisi di Cloud Monitoring, consulta la guida agli avvisi.