เรียนรู้วิธีการทำงาน อธิบาย และลดผลกระทบของข้อมูลรบกวนในรายงานที่รวบรวมได้
ก่อนเริ่มต้น
ก่อนที่จะดำเนินการต่อ หากต้องการทำความเข้าใจเชิงลึกเกี่ยวกับความหมายของสัญญาณรบกวนและผลกระทบที่เกิดขึ้น โปรดอ่านการทำความเข้าใจสัญญาณรบกวนในรายงานสรุป
การควบคุมเสียงรบกวน
แม้ว่าคุณจะไม่สามารถควบคุมสัญญาณรบกวนที่เพิ่มลงในรายงานที่รวบรวมได้โดยตรง แต่ก็มีขั้นตอนที่คุณสามารถทำได้เพื่อลดผลกระทบที่อาจเกิดขึ้น ส่วนต่อไปนี้จะอธิบายกลยุทธ์เหล่านี้
เพิ่มให้เท่ากับงบประมาณการสนับสนุน
ตามที่อธิบายไว้ในส่วน "ทำความเข้าใจสัญญาณรบกวน" สัญญาณรบกวนที่ใช้กับค่าสรุปของแต่ละคีย์จะอิงตามมาตราส่วน 0-65,536 (0-CONTRIBUTION_BUDGET
)
ด้วยเหตุนี้ เพื่อเพิ่มสัญญาณให้สูงที่สุดโดยสัมพันธ์กับสัญญาณรบกวน คุณจึงควรเพิ่มสเกลแต่ละค่าก่อนที่จะตั้งเป็นค่าที่รวมได้ กล่าวคือ นำแต่ละค่าไปคูณกับปัจจัยเฉพาะหรือปัจจัยการปรับขนาด ขณะเดียวกันก็เพื่อให้ค่ายังอยู่ในงบประมาณการมีส่วนร่วม
กำลังคำนวณค่าตัวคูณมาตราส่วน
ค่าตัวคูณมาตราส่วนแสดงถึงปริมาณที่คุณต้องการปรับค่าที่รวบรวมได้ที่ระบุ โดยค่าของงบประมาณสนับสนุนควรเป็นงบประมาณสนับสนุนหารด้วยค่าสูงสุดที่รวบรวมได้สำหรับคีย์ใดคีย์หนึ่ง
ตัวอย่างเช่น สมมติว่าผู้ลงโฆษณาต้องการทราบมูลค่าการซื้อทั้งหมด คุณทราบว่ามูลค่าการซื้อสูงสุดที่คาดไว้สำหรับการซื้อแต่ละครั้งคือ 60,000 บาท ยกเว้นค่าผิดปกติบางรายการที่คุณตัดสินใจที่จะละเว้น
- คำนวณค่าตัวคูณมาตราส่วน
- หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงสุด คุณต้องปรับขนาดค่านี้เป็น 65,536 (งบประมาณการมีส่วนร่วม)
- ซึ่งส่งผลให้ค่าตัวคูณมาตราส่วนประมาณ 32x เท่ากับ 65,536 / 2,000 ในทางปฏิบัติ คุณสามารถปัดเศษของปัจจัยนี้ขึ้นหรือลงได้
- เพิ่มขนาดค่าก่อนการรวม สําหรับการซื้อทุกๆ $1 ให้เพิ่มเมตริกที่ติดตามอีก 32 เช่น สำหรับการซื้อ 3,600 บาท ให้กำหนดค่าที่รวมได้เป็น 120*32 = 3,840
- ลดขนาดค่าลงหลังจากการรวม เมื่อได้รับรายงานสรุปที่มีมูลค่าการซื้อที่สรุปรวมจากผู้ใช้หลายคน ให้ลดขนาดมูลค่าสรุปโดยใช้ปัจจัยการปรับขนาดที่ใช้ก่อนการรวม ในตัวอย่างของเรา เราใช้ตัวคูณมาตราส่วนเป็นการรวมข้อมูลล่วงหน้า 32 ดังนั้นเราต้องนำค่าสรุปที่ได้รับในรายงานสรุปมาหารด้วย 32 ดังนั้น หากมูลค่าการซื้อโดยสรุปสำหรับคีย์ที่ระบุในรายงานสรุปคือ 76,800 มูลค่าการซื้อโดยสรุป (มีสัญญาณรบกวน) จะเป็น 76,800/32 = $2,400
แบ่งงบประมาณ
หากมีเป้าหมายการวัดหลายอย่าง เช่น ยอดรวมการซื้อและมูลค่าการซื้อ คุณอาจต้องแบ่งงบประมาณสําหรับเป้าหมายเหล่านี้
ในกรณีนี้ ปัจจัยการปรับขนาดจะแตกต่างออกไปสำหรับค่าที่รวบรวมได้ที่แตกต่างกัน ขึ้นอยู่กับค่าสูงสุดที่คาดไว้ของค่าที่รวบรวมได้ที่ระบุ
อ่านรายละเอียดในการทำความเข้าใจคีย์การรวม
ตัวอย่างเช่น สมมติว่าคุณกำลังติดตามทั้งจำนวนการซื้อและมูลค่าการซื้อ และคุณตัดสินใจที่จะจัดสรรงบประมาณเท่าๆ กัน
65,536 / 2 = 32,768 สามารถจัดสรรได้ตามประเภทการวัดผลและต่อแหล่งที่มา
- จำนวนการซื้อ:
- คุณกำลังติดตามการซื้อเพียงครั้งเดียว ดังนั้นจำนวนการซื้อสูงสุดสำหรับ Conversion ที่ระบุคือ 1
- ดังนั้นคุณจึงตัดสินใจตั้งค่าตัวคูณมาตราส่วนสำหรับจำนวนการซื้อเป็น 32,768 / 1 = 32,768
- มูลค่าการซื้อ:
- สมมติว่ามูลค่าการซื้อสูงสุดที่คาดไว้สำหรับการซื้อแต่ละครั้งคือ 60,000 บาท
- ดังนั้นคุณจึงตัดสินใจตั้งค่าตัวคูณมาตราส่วนสำหรับมูลค่าการซื้อเป็น 32,768 / 2,000 = 16.384 หรือประมาณ 16
คีย์การรวมข้อมูลหยาบจะช่วยปรับปรุงอัตราส่วนสัญญาณต่อเสียงรบกวน
เนื่องจากคีย์คร่าวๆ จะตรวจจับเหตุการณ์ Conversion ได้มากกว่าคีย์แบบละเอียด คีย์คร่าวๆ จึงมักทำให้เกิดค่าสรุปที่สูงกว่า
ค่าสรุปที่สูงกว่าจะได้รับผลกระทบจากสัญญาณรบกวนน้อยกว่าค่าที่ต่ำกว่า สัญญาณรบกวนในค่าเหล่านี้มีแนวโน้มที่จะต่ำกว่า เมื่อเทียบกับค่านี้
ค่าที่รวบรวมด้วยคีย์ที่มีขนาดหยาบมีแนวโน้มที่จะมีเสียงรบกวนน้อยกว่าค่าที่รวบรวมด้วยคีย์ที่มีความละเอียดมากกว่า
ตัวอย่าง
หากปัจจัยอื่นทั้งหมดไม่เท่ากัน คีย์ที่ติดตามมูลค่าการซื้อทั่วโลก (รวมกันในทุกประเทศ) จะทําให้มูลค่าการซื้อโดยสรุปสูงกว่า (และจํานวน Conversion สรุปสูงกว่า) มากกว่าคีย์ที่ติดตาม Conversion ในระดับประเทศ
ดังนั้น ความผันผวนสัมพัทธ์ในมูลค่าการซื้อรวมของแต่ละประเทศจะสูงกว่าความผันผวนสัมพัทธ์ในมูลค่าการซื้อรวมของทุกประเทศ
ในทำนองเดียวกัน หากปัจจัยอื่นทั้งหมดมีมูลค่าเท่ากัน มูลค่าการซื้อรองเท้าโดยรวมจะต่ำกว่ามูลค่าการซื้อรวมสำหรับสินค้าทั้งหมด (รวมถึงรองเท้า)
ดังนั้น ความผันผวนสัมพัทธ์ในมูลค่าการซื้อรองเท้าทั้งหมดจะสูงกว่าความผันผวนสัมพัทธ์ในมูลค่าการซื้อรวมสำหรับสินค้าทั้งหมด
การสรุปค่าสรุป (ภาพรวม) ยังสรุปข้อมูลที่ได้มา
การรวมค่าสรุปจากรายงานสรุปเพื่อเข้าถึงข้อมูลในระดับที่สูงขึ้น จะช่วยให้คุณสรุปข้อมูลรบกวนจากค่าสรุปเหล่านี้ได้ด้วย
เรามาดู 2 แนวทางที่แตกต่างกันกัน - วิธีการ ก: ให้ระบุรหัสภูมิศาสตร์ในคีย์ รายงานสรุปจะแสดงคีย์ระดับรหัสภูมิศาสตร์ โดยแต่ละคีย์จะเชื่อมโยงกับมูลค่าการซื้อโดยสรุปที่ระดับรหัสภูมิศาสตร์ที่เฉพาะเจาะจง - วิธีการ ข: คุณไม่ได้ใส่รหัสภูมิศาสตร์ในคีย์ รายงานสรุปจะแสดงมูลค่าการซื้อโดยสรุปสำหรับรหัสพื้นที่ / สถานที่ตั้งทั้งหมดโดยตรง
วิธีเข้าถึงมูลค่าการซื้อระดับประเทศ - ด้วยวิธีการ A คุณจะรวมค่าสรุประดับรหัสภูมิศาสตร์และรวมค่าที่ได้ ซึ่งมีแนวโน้มที่จะทำให้มูลค่าการซื้อระดับรหัสภูมิศาสตร์สุดท้ายมีความผันผวนมากขึ้น - ใช้วิธีการ ข คุณจะดูข้อมูลที่แสดงในรายงานสรุปได้โดยตรง มีการเพิ่มเสียงรบกวนในข้อมูลนั้นเพียงครั้งเดียว
ดังนั้น มูลค่าการซื้อโดยสรุปสำหรับรหัสภูมิศาสตร์หนึ่งๆ มีแนวโน้มที่จะแสดงเสียงดังได้มากกว่าเมื่อใช้แนวทาง A
ในทำนองเดียวกัน การรวมมิติข้อมูลระดับรหัสไปรษณีย์ไว้ในคีย์ของคุณมีแนวโน้มที่จะทำให้เกิดผลการค้นหาที่มีเสียงดังมากกว่าการใช้คีย์ขนาดหยาบกับมิติข้อมูลระดับภูมิภาค
การรวมในช่วงเวลาที่นานขึ้นจะเพิ่มอัตราส่วนสัญญาณต่อเสียงรบกวน
การขอรายงานสรุปบ่อยน้อยลงหมายความว่าค่าสรุปแต่ละค่ามีแนวโน้มที่จะสูงกว่าการที่คุณขอรายงานบ่อยขึ้น Conversion จะมีโอกาสเกิดขึ้น มากขึ้นในระยะเวลาที่ยาวนานขึ้น
ดังที่กล่าวไว้ก่อนหน้านี้ ยิ่งค่าสรุปสูงเท่าใด ก็ยิ่งมีโอกาสที่สิ่งรบกวนที่เกี่ยวข้องน้อยลงเท่านั้น ดังนั้น การขอรายงานสรุปมักนำไปสู่อัตราส่วนสัญญาณต่อสัญญาณรบกวนที่สูงขึ้น (ดีกว่า)
ลองดูตัวอย่างต่อไปนี้
- หากคุณขอรายงานสรุปรายชั่วโมงนานกว่า 24 ชั่วโมง แล้วสรุปค่าสรุปจากรายงานรายชั่วโมงแต่ละฉบับเพื่อเข้าถึงข้อมูลระดับวัน ข้อมูลรบกวนจะเพิ่มขึ้น 24 ครั้ง
- ในรายงานสรุปรายวัน 1 ฉบับ ระบบจะเพิ่มสัญญาณรบกวนเพียงครั้งเดียว
Epsilon สูงขึ้น เสียงรบกวนต่ำ
ยิ่งค่าของ Epsilon สูงขึ้นเท่าใด สัญญาณรบกวนก็ยิ่งต่ำลงและการคุ้มครองความเป็นส่วนตัวก็จะยิ่งต่ำลง
การใช้ประโยชน์จากการกรองและการกรองข้อมูลที่ซ้ำกันออก
ส่วนสำคัญของการจัดสรรงบประมาณระหว่างคีย์ต่างๆ คือการทำความเข้าใจจำนวนครั้งที่จะเกิดเหตุการณ์หนึ่งๆ ได้ ตัวอย่างเช่น ผู้ลงโฆษณาอาจสนใจการซื้อเพียงครั้งเดียวสำหรับแต่ละคลิก แต่อาจสนใจ "การดูหน้าผลิตภัณฑ์" สูงสุด 3 รายการ Conversion เพื่อรองรับกรณีการใช้งานเหล่านี้ คุณอาจต้องใช้ประโยชน์จากฟีเจอร์ของ API ต่อไปนี้ที่จะช่วยให้คุณสามารถควบคุมจำนวนรายงานที่จะสร้างขึ้นและ Conversion ที่จะนับ
- การกรอง อ่านเพิ่มเติมเกี่ยวกับการกรอง
- การกรองข้อมูลที่ซ้ำกันออก อ่านเพิ่มเติมเกี่ยวกับการกรองข้อมูลที่ซ้ำกันออก
ทดลองใช้ epsilon
เทคโนโลยีโฆษณาสามารถกำหนดค่า epsilon ให้เป็นค่าที่มากกว่า 0 ขึ้นไปและรวม 64 ได้ โดยช่วงนี้จะช่วยให้ทดสอบได้อย่างยืดหยุ่น ค่าของ epsilon ในระดับต่ำจะช่วยคุ้มครองความเป็นส่วนตัวได้มากขึ้น เราขอแนะนำให้เริ่มต้นด้วย epsilon=10
คำแนะนำในการทดสอบ
เราขอแนะนำให้ทำดังนี้ - เริ่มต้นด้วย epsilon = 10 - ในกรณีที่ทำให้เกิดปัญหาด้านสาธารณูปโภคที่ระบุได้ ให้เพิ่ม epsilon เพิ่มทีละน้อย - แชร์ความคิดเห็นเกี่ยวกับจุดเปลี่ยนผันที่คุณอาจพบเกี่ยวกับความสามารถในการใช้งานข้อมูล
มีส่วนร่วมและแชร์ความคิดเห็น
คุณสามารถเข้าร่วมและทดสอบกับ API นี้
- อ่านเกี่ยวกับรายงานที่รวบรวมได้และบริการรวบรวมข้อมูล ถามคำถาม และแนะนำความคิดเห็น
- อ่านคู่มือการรายงานการระบุแหล่งที่มา
- ถามคำถามและเข้าร่วมการสนทนาในที่เก็บการสนับสนุนนักพัฒนาซอฟต์แวร์ Privacy Sandbox
ขั้นตอนถัดไป
- ดูข้อมูลเพิ่มเติมเกี่ยวกับปัจจัยที่มีผลต่อการรายงาน เช่น ตัวแปรแคมเปญ ความถี่แบบกลุ่ม และรายละเอียดมิติข้อมูลได้ที่การทดสอบด้วยการตัดสินใจออกแบบรายงานสรุป
- ลองใช้ Noise Lab ดู