ความคาดหวังเกี่ยวกับข้อมูลการรายงาน

คู่มือนี้อธิบายข้อมูลสำคัญเกี่ยวกับข้อมูลที่คุณเห็นในรายงาน ที่สร้างขึ้นโดยใช้ Google Analytics Data API ผู้ใช้มักพบความคลาดเคลื่อนระหว่างข้อมูลที่ API แสดงผล (โดยเฉพาะเมธอด runReport) กับข้อมูลที่แสดงใน UI ของ Google Analytics

การสุ่มตัวอย่างและการรวมข้อมูล

เมธอด Data API ของ Google Analytics runReport สามารถแสดงข้อมูลจากการสุ่มตัวอย่าง โดยเฉพาะอย่างยิ่งสําหรับชุดข้อมูลขนาดใหญ่หรือการค้นหาที่ซับซ้อน แม้ว่า UI ของ Google Analytics จะใช้การสุ่มตัวอย่างด้วย แต่เกณฑ์และอัลกอริทึมที่เฉพาะเจาะจงอาจแตกต่างกัน ซึ่งส่งผลให้ค่าที่รายงานแตกต่างกันเล็กน้อย

หากต้องการทราบว่าผลลัพธ์ของรายงานอิงตามชุดข้อมูลย่อยของข้อมูลที่มีหรือไม่ ให้ตรวจสอบฟิลด์ samplingMetadatas ของออบเจ็กต์ ResponseMetaData หากผลลัพธ์ของรายงานเป็นแบบสุ่มตัวอย่าง ฟิลด์นี้จะอธิบายเปอร์เซ็นต์ของเหตุการณ์ที่ใช้ในรายงานนี้

วิธีการรายงานบางอย่างของ Google Analytics Data API ช่วยให้คุณ ระบุระดับการสุ่มตัวอย่างที่ต้องการได้ คุณสามารถใช้ฟิลด์ samplingLevel ของเมธอด properties.reportTasks.create เพื่อควบคุมระดับการสุ่มตัวอย่างของรายงานได้

ฟีเจอร์นี้ช่วยให้พร็อพเพอร์ตี้ Google Analytics 360 เข้าถึงขีดจํากัดการเก็บตัวอย่างที่สูงขึ้นได้ถึง 1,000 ล้านเหตุการณ์ นอกจากนี้ คุณยังตั้งค่าขีดจํากัดการสุ่มตัวอย่างเป็น UNSAMPLED เพื่อใช้ผลลัพธ์ที่ไม่ได้สุ่มตัวอย่างสําหรับจํานวนเหตุการณ์ขนาดใหญ่ได้ด้วย

ดูข้อมูลเพิ่มเติมได้ที่เกี่ยวกับการสุ่มตัวอย่างข้อมูล

การประมาณจำนวนที่ไม่ซ้ำกัน

Data API ของ Google Analytics ใช้อัลกอริทึม HyperLogLog++ (HLL++) เพื่อ ประมาณจํานวนที่ไม่ซ้ำกันสําหรับเมตริก เช่น ผู้ใช้ที่ใช้งานอยู่และเซสชัน วิธีนี้ใช้ใน API และ UI ของ Google Analytics เพื่อปรับปรุงประสิทธิภาพ และจัดการชุดข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพ ซึ่งหมายความว่าผลลัพธ์เป็น ค่าประมาณ ไม่ใช่จำนวนที่แน่นอน

ดูบริบทเพิ่มเติมได้ที่แหล่งข้อมูลต่อไปนี้ การประมาณจํานวนที่ไม่ซ้ำกันใน Google Analytics และ ความแตกต่างในจํานวนผู้ใช้

การกำหนดจำนวนข้อมูลขั้นต่ำที่ต้องการ

Google Analytics อาจใช้การกำหนดจำนวนข้อมูลขั้นต่ำที่ต้องการกับรายงานเพื่อป้องกันการระบุตัวตนของผู้ใช้แต่ละรายตามข้อมูลประชากร ความสนใจ หรือสัญญาณอื่นๆ ที่แสดงในข้อมูล

หากแถวรายงานมีผู้ใช้จำนวนน้อย ระบบอาจยกเว้นแถวดังกล่าว จากผลลัพธ์ ซึ่งมักเกิดขึ้นในรายงานที่มีมิติข้อมูลที่มีจำนวนค่าที่เป็นไปได้สูง หรือมิติข้อมูลที่กำหนดเอง

หากต้องการทราบว่ารายงานนี้อยู่ภายใต้การกำหนดเกณฑ์ขั้นต่ำหรือไม่ ให้ตรวจสอบฟิลด์ subjectToThresholding ของออบเจ็กต์ ResponseMetaData

ดูข้อมูลเพิ่มเติมได้ที่จำนวนข้อมูลขั้นต่ำที่ต้องการ

แถว (other)

หากมิติข้อมูลมี Cardinality สูง Google Analytics อาจจัดกลุ่มค่าที่พบน้อยกว่า ไว้ในแถวที่มีป้ายกํากับเป็น (other) ซึ่งมักพบในรายงาน ที่มีมิติข้อมูลที่มีค่าที่ไม่ซ้ำกันมากกว่า 500 ค่าต่อวัน

เมื่อใช้ตัวกรองกับ Data API โปรดทราบว่าตัวกรองจะไม่ดูภายใน(other) แถว และจะใช้หลังจากรวบรวมข้อมูลและสร้าง(other) แถวแล้ว

หากต้องการทราบว่ารายงานมีข้อมูลที่รวมไว้ในแถว (other) หรือไม่ ให้ตรวจสอบฟิลด์ dataLossFromOtherRow ของออบเจ็กต์ ResponseMetaData

ดูข้อมูลเพิ่มเติมได้ที่แถว(อื่นๆ) ใน Google Analytics

ข้อมูลระบุตัวตนในการรายงาน

ข้อมูลระบุตัวตนในการรายงาน จะกำหนดวิธีกรองผู้ใช้ที่ซ้ำกันออกในรายงาน การตั้งค่าข้อมูลประจำตัวที่แตกต่างกัน (เช่น "ผสม" หรือ "อิงตามอุปกรณ์") อาจส่งผลให้จำนวนผู้ใช้แตกต่างกัน สำหรับช่วงวันที่เดียวกัน

ทั้ง UI ของ Google Analytics และ Data API ใช้การตั้งค่าข้อมูลระบุตัวตนในการรายงานเดียวกันสำหรับพร็อพเพอร์ตี้ หากมีการเปลี่ยนแปลงการตั้งค่านี้ จะส่งผลต่อรายงานทั้งใน UI และ API หากมีการเปลี่ยนแปลงการตั้งค่าระหว่างการเรียกใช้รายงานใน UI กับการรับข้อมูลรายงานผ่าน API จำนวนผู้ใช้อาจแตกต่างกันระหว่างรายงานทั้ง 2 ฉบับสำหรับช่วงวันที่เดียวกัน

ความเฉพาะเจาะจงของการค้นหา

เพื่อให้ความคลาดเคลื่อนน้อยที่สุด โปรดตรวจสอบว่าพารามิเตอร์ต่อไปนี้ในคำขอ API ตรงกับการตั้งค่าในรายงาน UI ของ Google Analytics อย่างแม่นยำ

  • ช่วงวันที่: ตรวจสอบว่าวันที่เริ่มต้นและวันที่สิ้นสุดเหมือนกัน
  • มิติข้อมูลและเมตริก: ตรวจสอบว่ามิติข้อมูลและเมตริกในคำขอ API เหมือนกับมิติข้อมูลและเมตริกในรายงาน UI ของ Google Analytics
  • ตัวกรอง: ตรวจสอบว่าตัวกรองมิติข้อมูลหรือเมตริกที่ใช้ในคำขอ API ตรงกับตัวกรองที่ใช้ใน UI

การเพิ่มมิติข้อมูลลงในรายงานอาจส่งผลให้มีการใช้เหตุการณ์น้อยลงในการคำนวณ ระบบจะรวมเฉพาะเหตุการณ์ที่มีข้อมูลสําหรับมิติข้อมูลที่ขอไว้ ในรายงาน ดังนั้น การเพิ่มมิติข้อมูลลงในการค้นหาจึงอาจ เปลี่ยนค่ารวมของเมตริกในรายงานได้

ความใหม่ของข้อมูล

Google Analytics ต้องใช้เวลาในการประมวลผลและรวบรวมข้อมูลเหตุการณ์ เมื่อทํางานกับข้อมูลล่าสุด คุณอาจเห็นความแตกต่างเล็กน้อยระหว่างรายงานหากมีความล่าช้าด้านเวลาระหว่างการดึงข้อมูล เช่น หากคุณดูรายงานใน UI แล้วเรียกใช้ API สำหรับรายงานเดียวกันในอีกไม่กี่นาทีต่อมา ข้อมูลอาจมีการเปลี่ยนแปลงเนื่องจากการประมวลผลและการรวบรวมที่กำลังดำเนินการอยู่

ดูข้อมูลเพิ่มเติมได้ที่ความใหม่ของข้อมูล

ทางเลือกแทนข้อมูลแบบไม่สุ่มตัวอย่าง

หากกรณีการใช้งานของคุณต้องใช้ข้อมูลระดับเหตุการณ์แบบเต็มที่ไม่ได้สุ่มตัวอย่าง ให้ลองใช้ทางเลือกต่อไปนี้

  • BigQuery Export: BigQuery Export สำหรับ Google Analytics

    เป็นวิธีที่แนะนําสําหรับการวิเคราะห์ขั้นสูงของข้อมูลเหตุการณ์ดิบ

  • Analytics 360: พร็อพเพอร์ตี้ที่มีใบอนุญาต Analytics 360 จะมี ขีดจํากัดการเก็บตัวอย่างที่สูงกว่าและเข้าถึงฟีเจอร์การรายงานแบบละเอียดได้มากขึ้น