การเพิ่มประสิทธิภาพเริ่มต้นด้วยการระบุเมตริกหลัก ซึ่งมักจะเกี่ยวข้องกับเวลาในการตอบสนองและอัตราการรับส่งข้อมูล การเพิ่มการตรวจสอบเพื่อบันทึกและติดตามเมตริกเหล่านี้จะแสดงจุดอ่อนในแอปพลิเคชัน เมตริกช่วยให้คุณเพิ่มประสิทธิภาพเพื่อปรับปรุงเมตริกประสิทธิภาพได้
นอกจากนี้ เครื่องมือตรวจสอบจํานวนมากยังให้คุณตั้งค่าการแจ้งเตือนสําหรับเมตริกได้ เพื่อให้คุณได้รับการแจ้งเตือนเมื่อถึงเกณฑ์ที่กำหนด เช่น คุณอาจตั้งค่าการแจ้งเตือนให้ส่งการแจ้งเตือนเมื่อเปอร์เซ็นต์ของคำขอที่ไม่สำเร็จเพิ่มขึ้นมากกว่า x% ของระดับปกติ เครื่องมือตรวจสอบจะช่วยให้คุณทราบว่าประสิทธิภาพปกติเป็นอย่างไร และระบุการเพิ่มขึ้นอย่างผิดปกติของเวลาในการตอบสนอง จำนวนข้อผิดพลาด และเมตริกหลักอื่นๆ ความสามารถในการตรวจสอบเมตริกเหล่านี้มีความสําคัญอย่างยิ่งในช่วงเวลาสําคัญทางธุรกิจ หรือหลังจากที่มีการพุชโค้ดใหม่ไปยังเวอร์ชันที่ใช้งานจริง
ระบุเมตริกเวลาในการตอบสนอง
ตรวจสอบว่า UI ของคุณตอบสนองได้เร็วที่สุดเท่าที่จะทำได้ โดยทราบว่าผู้ใช้คาดหวังมาตรฐานที่สูงขึ้นจากแอปบนอุปกรณ์เคลื่อนที่ นอกจากนี้ คุณควรวัดและติดตามเวลาในการตอบสนองของบริการแบ็กเอนด์ด้วย เนื่องจากอาจทำให้เกิดปัญหาเกี่ยวกับปริมาณข้อมูลได้หากไม่ตรวจสอบ
เมตริกที่แนะนําให้ติดตามมีดังนี้
- ระยะเวลาของคำขอ
- ระยะเวลาของคำขอในระดับรายละเอียดของซับระบบ (เช่น การเรียก API)
- ระยะเวลาของงาน
ระบุเมตริกปริมาณข้อมูล
ปริมาณข้อมูลเป็นค่าที่วัดจํานวนคําขอทั้งหมดที่แสดงในระยะเวลาหนึ่งๆ ปริมาณงานอาจได้รับผลกระทบจากเวลาในการตอบสนองของระบบย่อย คุณจึงอาจต้องเพิ่มประสิทธิภาพเวลาในการตอบสนองเพื่อปรับปรุงปริมาณงาน
เมตริกที่แนะนําให้ติดตามมีดังนี้
- จำนวนคำค้นหาต่อวินาที
- ขนาดข้อมูลที่โอนต่อวินาที
- จำนวนการดำเนินการ I/O ต่อวินาที
- การใช้งานทรัพยากร เช่น การใช้งาน CPU หรือหน่วยความจำ
- ขนาดของงานประมวลผลที่รอดำเนินการ เช่น pub/sub หรือจํานวนเธรด
ไม่ใช่แค่ค่ามัธยฐาน
ข้อผิดพลาดที่พบบ่อยในการวัดประสิทธิภาพคือการดูเฉพาะค่ามัธยฐาน (ค่าเฉลี่ย) แม้ว่าข้อมูลนี้มีประโยชน์ แต่ก็ไม่ได้ให้ข้อมูลเชิงลึกเกี่ยวกับความถี่ของเวลาในการตอบสนอง เมตริกที่ดีกว่าในการติดตามคือเปอร์เซ็นต์ไทล์ของประสิทธิภาพ เช่น เปอร์เซ็นต์ไทล์ที่ 50/75/90/99 ของเมตริก
โดยทั่วไปแล้ว การเพิ่มประสิทธิภาพทำได้ 2 ขั้นตอน ขั้นแรก ให้เพิ่มประสิทธิภาพเพื่อเวลาในการตอบสนอง 90 เปอร์เซ็นต์ จากนั้นให้พิจารณาเปอร์เซ็นต์ไทล์ที่ 99 หรือที่เรียกว่าเวลาในการตอบสนองส่วนปลาย ซึ่งเป็นคำขอส่วนน้อยที่ใช้เวลานานกว่ามากจึงจะเสร็จสมบูรณ์
การตรวจสอบฝั่งเซิร์ฟเวอร์เพื่อดูผลลัพธ์โดยละเอียด
โดยทั่วไปแล้ว โปรไฟล์ฝั่งเซิร์ฟเวอร์เป็นที่นิยมสําหรับเมตริกการติดตาม โดยปกติแล้ว ฝั่งเซิร์ฟเวอร์จะติดตั้งเครื่องมือได้ง่ายกว่ามาก ช่วยให้เข้าถึงข้อมูลที่ละเอียดยิ่งขึ้น และไม่ค่อยได้รับผลกระทบจากปัญหาการเชื่อมต่อ
การตรวจสอบเบราว์เซอร์เพื่อการแสดงผลจากต้นทางถึงปลายทาง
การสร้างโปรไฟล์เบราว์เซอร์จะให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับประสบการณ์ของผู้ใช้ปลายทาง ซึ่งจะแสดงหน้าเว็บที่มีคำขอช้า จากนั้นคุณสามารถเชื่อมโยงกับการตรวจสอบฝั่งเซิร์ฟเวอร์เพื่อการวิเคราะห์เพิ่มเติม
Google Analytics มีการตรวจสอบเวลาในการโหลดหน้าเว็บที่พร้อมใช้งานทันทีในรายงานเวลาในการโหลดหน้าเว็บ ซึ่งจะมีมุมมองที่เป็นประโยชน์หลายมุมมองสําหรับทําความเข้าใจประสบการณ์ของผู้ใช้บนเว็บไซต์ โดยเฉพาะมุมมองต่อไปนี้
- เวลาในการโหลดหน้าเว็บ
- เวลาในการโหลดการเปลี่ยนเส้นทาง
- เวลาในการตอบกลับของเซิร์ฟเวอร์
การตรวจสอบในระบบคลาวด์
มีเครื่องมือมากมายที่คุณสามารถใช้เพื่อบันทึกและตรวจสอบเมตริกประสิทธิภาพสําหรับแอปพลิเคชัน ตัวอย่างเช่น คุณสามารถใช้ Google Cloud Logging เพื่อบันทึกเมตริกประสิทธิภาพลงในโปรเจ็กต์ Google Cloud จากนั้นตั้งค่าแดชบอร์ดใน Google Cloud Monitoring เพื่อตรวจสอบและแบ่งกลุ่มเมตริกที่บันทึกไว้
ดูตัวอย่างการบันทึกลงในบันทึกของ Google Cloud จากอินเตอร์เซปเตอร์ที่กําหนดเองในไลบรารีของไคลเอ็นต์ Python ในคู่มือการบันทึก เมื่อข้อมูลดังกล่าวพร้อมใช้งานใน Google Cloud แล้ว คุณสามารถสร้างเมตริกจากข้อมูลที่บันทึกไว้เพื่อดูข้อมูลแอปพลิเคชันผ่าน Google Cloud Monitoring ทำตามคําแนะนําสําหรับเมตริกตามบันทึกที่กําหนดโดยผู้ใช้เพื่อสร้างเมตริกโดยใช้บันทึกที่ส่งไปยัง Google Cloud Logging
หรือจะใช้ไลบรารีไคลเอ็นต์การตรวจสอบเพื่อกําหนดเมตริกในโค้ดและส่งไปยังการตรวจสอบโดยตรงแยกจากบันทึกก็ได้
ตัวอย่างเมตริกตามบันทึก
สมมติว่าคุณต้องการตรวจสอบค่า is_fault
เพื่อให้เข้าใจอัตราข้อผิดพลาดในแอปพลิเคชันได้ดียิ่งขึ้น คุณสามารถดึงค่า is_fault
จากบันทึกมาใส่ในเมตริกตัวนับ ErrorCount
ใหม่ได้
ใน Cloud Logging ป้ายกํากับช่วยให้คุณจัดกลุ่มเมตริกเป็นหมวดหมู่ได้ โดยอิงตามข้อมูลอื่นๆ ในบันทึก คุณสามารถกําหนดค่าป้ายกํากับสําหรับmethod
ช่องที่ส่งไปยังการบันทึกในระบบคลาวด์เพื่อดูรายละเอียดจํานวนข้อผิดพลาดตามเมธอด Google Ads API
เมื่อกําหนดค่าเมตริก ErrorCount
และป้ายกํากับ Method
แล้ว คุณจะสร้างแผนภูมิใหม่ในหน้าแดชบอร์ดการตรวจสอบเพื่อตรวจสอบ ErrorCount
ซึ่งจัดกลุ่มตาม Method
ได้
การแจ้งเตือน
คุณสามารถกําหนดค่านโยบายการแจ้งเตือนในการตรวจสอบระบบคลาวด์และเครื่องมืออื่นๆ ซึ่งจะระบุเวลาและวิธีที่เมตริกควรทริกเกอร์การแจ้งเตือน ดูวิธีการตั้งค่าการแจ้งเตือนของ Cloud Monitoring ได้ที่คู่มือการแจ้งเตือน