การตรวจสอบ

การเพิ่มประสิทธิภาพเริ่มต้นด้วยการระบุเมตริกหลัก ซึ่งมักจะเกี่ยวข้องกับเวลาในการตอบสนองและอัตราการรับส่งข้อมูล การเพิ่มการตรวจสอบเพื่อบันทึกและติดตามเมตริกเหล่านี้จะแสดงจุดอ่อนในแอปพลิเคชัน เมตริกช่วยให้คุณเพิ่มประสิทธิภาพเพื่อปรับปรุงเมตริกประสิทธิภาพได้

นอกจากนี้ เครื่องมือตรวจสอบจํานวนมากยังให้คุณตั้งค่าการแจ้งเตือนสําหรับเมตริกได้ เพื่อให้คุณได้รับการแจ้งเตือนเมื่อถึงเกณฑ์ที่กำหนด เช่น คุณอาจตั้งค่าการแจ้งเตือนให้ส่งการแจ้งเตือนเมื่อเปอร์เซ็นต์ของคำขอที่ไม่สำเร็จเพิ่มขึ้นมากกว่า x% ของระดับปกติ เครื่องมือตรวจสอบจะช่วยให้คุณทราบว่าประสิทธิภาพปกติเป็นอย่างไร และระบุการเพิ่มขึ้นอย่างผิดปกติของเวลาในการตอบสนอง จำนวนข้อผิดพลาด และเมตริกหลักอื่นๆ ความสามารถในการตรวจสอบเมตริกเหล่านี้มีความสําคัญอย่างยิ่งในช่วงเวลาสําคัญทางธุรกิจ หรือหลังจากที่มีการพุชโค้ดใหม่ไปยังเวอร์ชันที่ใช้งานจริง

ระบุเมตริกเวลาในการตอบสนอง

ตรวจสอบว่า UI ของคุณตอบสนองได้เร็วที่สุดเท่าที่จะทำได้ โดยทราบว่าผู้ใช้คาดหวังมาตรฐานที่สูงขึ้นจากแอปบนอุปกรณ์เคลื่อนที่ นอกจากนี้ คุณควรวัดและติดตามเวลาในการตอบสนองของบริการแบ็กเอนด์ด้วย เนื่องจากอาจทำให้เกิดปัญหาเกี่ยวกับปริมาณข้อมูลได้หากไม่ตรวจสอบ

เมตริกที่แนะนําให้ติดตามมีดังนี้

  • ระยะเวลาของคำขอ
  • ระยะเวลาของคำขอในระดับรายละเอียดของซับระบบ (เช่น การเรียก API)
  • ระยะเวลาของงาน

ระบุเมตริกปริมาณข้อมูล

ปริมาณข้อมูลเป็นค่าที่วัดจํานวนคําขอทั้งหมดที่แสดงในระยะเวลาหนึ่งๆ ปริมาณงานอาจได้รับผลกระทบจากเวลาในการตอบสนองของระบบย่อย คุณจึงอาจต้องเพิ่มประสิทธิภาพเวลาในการตอบสนองเพื่อปรับปรุงปริมาณงาน

เมตริกที่แนะนําให้ติดตามมีดังนี้

  • จำนวนคำค้นหาต่อวินาที
  • ขนาดข้อมูลที่โอนต่อวินาที
  • จำนวนการดำเนินการ I/O ต่อวินาที
  • การใช้งานทรัพยากร เช่น การใช้งาน CPU หรือหน่วยความจำ
  • ขนาดของงานประมวลผลที่รอดำเนินการ เช่น pub/sub หรือจํานวนเธรด

ไม่ใช่แค่ค่ามัธยฐาน

ข้อผิดพลาดที่พบบ่อยในการวัดประสิทธิภาพคือการดูเฉพาะค่ามัธยฐาน (ค่าเฉลี่ย) แม้ว่าข้อมูลนี้มีประโยชน์ แต่ก็ไม่ได้ให้ข้อมูลเชิงลึกเกี่ยวกับความถี่ของเวลาในการตอบสนอง เมตริกที่ดีกว่าในการติดตามคือเปอร์เซ็นต์ไทล์ของประสิทธิภาพ เช่น เปอร์เซ็นต์ไทล์ที่ 50/75/90/99 ของเมตริก

โดยทั่วไปแล้ว การเพิ่มประสิทธิภาพทำได้ 2 ขั้นตอน ขั้นแรก ให้เพิ่มประสิทธิภาพเพื่อเวลาในการตอบสนอง 90 เปอร์เซ็นต์ จากนั้นให้พิจารณาเปอร์เซ็นต์ไทล์ที่ 99 หรือที่เรียกว่าเวลาในการตอบสนองส่วนปลาย ซึ่งเป็นคำขอส่วนน้อยที่ใช้เวลานานกว่ามากจึงจะเสร็จสมบูรณ์

การตรวจสอบฝั่งเซิร์ฟเวอร์เพื่อดูผลลัพธ์โดยละเอียด

โดยทั่วไปแล้ว โปรไฟล์ฝั่งเซิร์ฟเวอร์เป็นที่นิยมสําหรับเมตริกการติดตาม โดยปกติแล้ว ฝั่งเซิร์ฟเวอร์จะติดตั้งเครื่องมือได้ง่ายกว่ามาก ช่วยให้เข้าถึงข้อมูลที่ละเอียดยิ่งขึ้น และไม่ค่อยได้รับผลกระทบจากปัญหาการเชื่อมต่อ

การตรวจสอบเบราว์เซอร์เพื่อการแสดงผลจากต้นทางถึงปลายทาง

การสร้างโปรไฟล์เบราว์เซอร์จะให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับประสบการณ์ของผู้ใช้ปลายทาง ซึ่งจะแสดงหน้าเว็บที่มีคำขอช้า จากนั้นคุณสามารถเชื่อมโยงกับการตรวจสอบฝั่งเซิร์ฟเวอร์เพื่อการวิเคราะห์เพิ่มเติม

Google Analytics มีการตรวจสอบเวลาในการโหลดหน้าเว็บที่พร้อมใช้งานทันทีในรายงานเวลาในการโหลดหน้าเว็บ ซึ่งจะมีมุมมองที่เป็นประโยชน์หลายมุมมองสําหรับทําความเข้าใจประสบการณ์ของผู้ใช้บนเว็บไซต์ โดยเฉพาะมุมมองต่อไปนี้

  • เวลาในการโหลดหน้าเว็บ
  • เวลาในการโหลดการเปลี่ยนเส้นทาง
  • เวลาในการตอบกลับของเซิร์ฟเวอร์

การตรวจสอบในระบบคลาวด์

มีเครื่องมือมากมายที่คุณสามารถใช้เพื่อบันทึกและตรวจสอบเมตริกประสิทธิภาพสําหรับแอปพลิเคชัน ตัวอย่างเช่น คุณสามารถใช้ Google Cloud Logging เพื่อบันทึกเมตริกประสิทธิภาพลงในโปรเจ็กต์ Google Cloud จากนั้นตั้งค่าแดชบอร์ดใน Google Cloud Monitoring เพื่อตรวจสอบและแบ่งกลุ่มเมตริกที่บันทึกไว้

ดูตัวอย่างการบันทึกลงในบันทึกของ Google Cloud จากอินเตอร์เซปเตอร์ที่กําหนดเองในไลบรารีของไคลเอ็นต์ Python ในคู่มือการบันทึก เมื่อข้อมูลดังกล่าวพร้อมใช้งานใน Google Cloud แล้ว คุณสามารถสร้างเมตริกจากข้อมูลที่บันทึกไว้เพื่อดูข้อมูลแอปพลิเคชันผ่าน Google Cloud Monitoring ทำตามคําแนะนําสําหรับเมตริกตามบันทึกที่กําหนดโดยผู้ใช้เพื่อสร้างเมตริกโดยใช้บันทึกที่ส่งไปยัง Google Cloud Logging

หรือจะใช้ไลบรารีไคลเอ็นต์การตรวจสอบเพื่อกําหนดเมตริกในโค้ดและส่งไปยังการตรวจสอบโดยตรงแยกจากบันทึกก็ได้

ตัวอย่างเมตริกตามบันทึก

สมมติว่าคุณต้องการตรวจสอบค่า is_fault เพื่อให้เข้าใจอัตราข้อผิดพลาดในแอปพลิเคชันได้ดียิ่งขึ้น คุณสามารถดึงค่า is_fault จากบันทึกมาใส่ในเมตริกตัวนับ ErrorCount ใหม่ได้

การกำหนดค่าเมตริก

ตัวกรองและป้ายกํากับในเมตริก

ใน Cloud Logging ป้ายกํากับช่วยให้คุณจัดกลุ่มเมตริกเป็นหมวดหมู่ได้ โดยอิงตามข้อมูลอื่นๆ ในบันทึก คุณสามารถกําหนดค่าป้ายกํากับสําหรับmethod ช่องที่ส่งไปยังการบันทึกในระบบคลาวด์เพื่อดูรายละเอียดจํานวนข้อผิดพลาดตามเมธอด Google Ads API

เมื่อกําหนดค่าเมตริก ErrorCount และป้ายกํากับ Method แล้ว คุณจะสร้างแผนภูมิใหม่ในหน้าแดชบอร์ดการตรวจสอบเพื่อตรวจสอบ ErrorCount ซึ่งจัดกลุ่มตาม Method ได้

แดชบอร์ด ErrorCount

การแจ้งเตือน

คุณสามารถกําหนดค่านโยบายการแจ้งเตือนในการตรวจสอบระบบคลาวด์และเครื่องมืออื่นๆ ซึ่งจะระบุเวลาและวิธีที่เมตริกควรทริกเกอร์การแจ้งเตือน ดูวิธีการตั้งค่าการแจ้งเตือนของ Cloud Monitoring ได้ที่คู่มือการแจ้งเตือน