การทำงานกับเสียงรบกวน

เรียนรู้วิธีการทำงาน อธิบาย และลดผลกระทบของข้อมูลรบกวนในรายงานที่รวบรวมได้

ก่อนเริ่มต้น

ก่อนที่จะดำเนินการต่อ หากต้องการทำความเข้าใจเชิงลึกเกี่ยวกับความหมายของสัญญาณรบกวนและผลกระทบที่เกิดขึ้น โปรดอ่านการทำความเข้าใจสัญญาณรบกวนในรายงานสรุป

การควบคุมเสียงรบกวน

แม้ว่าคุณจะไม่สามารถควบคุมสัญญาณรบกวนที่เพิ่มลงในรายงานที่รวบรวมได้โดยตรง แต่ก็มีขั้นตอนที่คุณสามารถทำได้เพื่อลดผลกระทบที่อาจเกิดขึ้น ส่วนต่อไปนี้จะอธิบายกลยุทธ์เหล่านี้

เพิ่มให้เท่ากับงบประมาณการสนับสนุน

ตามที่อธิบายไว้ในส่วน "ทำความเข้าใจสัญญาณรบกวน" สัญญาณรบกวนที่ใช้กับค่าสรุปของแต่ละคีย์จะอิงตามมาตราส่วน 0-65,536 (0-CONTRIBUTION_BUDGET)

การกระจายเสียงรบกวนตามงบประมาณ

ด้วยเหตุนี้ เพื่อเพิ่มสัญญาณให้สูงที่สุดโดยสัมพันธ์กับสัญญาณรบกวน คุณจึงควรเพิ่มสเกลแต่ละค่าก่อนที่จะตั้งเป็นค่าที่รวมได้ กล่าวคือ นำแต่ละค่าไปคูณกับปัจจัยเฉพาะหรือปัจจัยการปรับขนาด ขณะเดียวกันก็เพื่อให้ค่ายังอยู่ในงบประมาณการมีส่วนร่วม

เสียงรบกวนแบบสัมพัทธ์ที่มีและไม่มีการปรับขนาด

กำลังคำนวณค่าตัวคูณมาตราส่วน

ค่าตัวคูณมาตราส่วนแสดงถึงปริมาณที่คุณต้องการปรับค่าที่รวบรวมได้ที่ระบุ โดยค่าของงบประมาณสนับสนุนควรเป็นงบประมาณสนับสนุนหารด้วยค่าสูงสุดที่รวบรวมได้สำหรับคีย์ใดคีย์หนึ่ง

กำหนดปัจจัยการปรับขนาดโดยอิงตามงบประมาณการสนับสนุน

ตัวอย่างเช่น สมมติว่าผู้ลงโฆษณาต้องการทราบมูลค่าการซื้อทั้งหมด คุณทราบว่ามูลค่าการซื้อสูงสุดที่คาดไว้สำหรับการซื้อแต่ละครั้งคือ 60,000 บาท ยกเว้นค่าผิดปกติบางรายการที่คุณตัดสินใจที่จะละเว้น

  • คำนวณค่าตัวคูณมาตราส่วน
    • หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงสุด คุณต้องปรับขนาดค่านี้เป็น 65,536 (งบประมาณการมีส่วนร่วม)
    • ซึ่งส่งผลให้ค่าตัวคูณมาตราส่วนประมาณ 32x เท่ากับ 65,536 / 2,000 ในทางปฏิบัติ คุณสามารถปัดเศษของปัจจัยนี้ขึ้นหรือลงได้
  • เพิ่มขนาดค่าก่อนการรวม สําหรับการซื้อทุกๆ $1 ให้เพิ่มเมตริกที่ติดตามอีก 32 เช่น สำหรับการซื้อ 3,600 บาท ให้กำหนดค่าที่รวมได้เป็น 120*32 = 3,840
  • ลดขนาดค่าลงหลังจากการรวม เมื่อได้รับรายงานสรุปที่มีมูลค่าการซื้อที่สรุปรวมจากผู้ใช้หลายคน ให้ลดขนาดมูลค่าสรุปโดยใช้ปัจจัยการปรับขนาดที่ใช้ก่อนการรวม ในตัวอย่างของเรา เราใช้ตัวคูณมาตราส่วนเป็นการรวมข้อมูลล่วงหน้า 32 ดังนั้นเราต้องนำค่าสรุปที่ได้รับในรายงานสรุปมาหารด้วย 32 ดังนั้น หากมูลค่าการซื้อโดยสรุปสำหรับคีย์ที่ระบุในรายงานสรุปคือ 76,800 มูลค่าการซื้อโดยสรุป (มีสัญญาณรบกวน) จะเป็น 76,800/32 = $2,400

แบ่งงบประมาณ

หากมีเป้าหมายการวัดหลายอย่าง เช่น ยอดรวมการซื้อและมูลค่าการซื้อ คุณอาจต้องแบ่งงบประมาณสําหรับเป้าหมายเหล่านี้

ในกรณีนี้ ปัจจัยการปรับขนาดจะแตกต่างออกไปสำหรับค่าที่รวบรวมได้ที่แตกต่างกัน ขึ้นอยู่กับค่าสูงสุดที่คาดไว้ของค่าที่รวบรวมได้ที่ระบุ

อ่านรายละเอียดในการทำความเข้าใจคีย์การรวม

ตัวอย่างเช่น สมมติว่าคุณกำลังติดตามทั้งจำนวนการซื้อและมูลค่าการซื้อ และคุณตัดสินใจที่จะจัดสรรงบประมาณเท่าๆ กัน

65,536 / 2 = 32,768 สามารถจัดสรรได้ตามประเภทการวัดผลและต่อแหล่งที่มา

  • จำนวนการซื้อ:
    • คุณกำลังติดตามการซื้อเพียงครั้งเดียว ดังนั้นจำนวนการซื้อสูงสุดสำหรับ Conversion ที่ระบุคือ 1
    • ดังนั้นคุณจึงตัดสินใจตั้งค่าตัวคูณมาตราส่วนสำหรับจำนวนการซื้อเป็น 32,768 / 1 = 32,768
  • มูลค่าการซื้อ:
    • สมมติว่ามูลค่าการซื้อสูงสุดที่คาดไว้สำหรับการซื้อแต่ละครั้งคือ 60,000 บาท
    • ดังนั้นคุณจึงตัดสินใจตั้งค่าตัวคูณมาตราส่วนสำหรับมูลค่าการซื้อเป็น 32,768 / 2,000 = 16.384 หรือประมาณ 16

คีย์การรวมข้อมูลหยาบจะช่วยปรับปรุงอัตราส่วนสัญญาณต่อเสียงรบกวน

เนื่องจากคีย์คร่าวๆ จะตรวจจับเหตุการณ์ Conversion ได้มากกว่าคีย์แบบละเอียด คีย์คร่าวๆ จึงมักทำให้เกิดค่าสรุปที่สูงกว่า

ค่าสรุปที่สูงกว่าจะได้รับผลกระทบจากสัญญาณรบกวนน้อยกว่าค่าที่ต่ำกว่า สัญญาณรบกวนในค่าเหล่านี้มีแนวโน้มที่จะต่ำกว่า เมื่อเทียบกับค่านี้

ค่าที่รวบรวมด้วยคีย์ที่มีขนาดหยาบมีแนวโน้มที่จะมีเสียงรบกวนน้อยกว่าค่าที่รวบรวมด้วยคีย์ที่มีความละเอียดมากกว่า

ตัวอย่าง

หากปัจจัยอื่นทั้งหมดไม่เท่ากัน คีย์ที่ติดตามมูลค่าการซื้อทั่วโลก (รวมกันในทุกประเทศ) จะทําให้มูลค่าการซื้อโดยสรุปสูงกว่า (และจํานวน Conversion สรุปสูงกว่า) มากกว่าคีย์ที่ติดตาม Conversion ในระดับประเทศ

ดังนั้น ความผันผวนสัมพัทธ์ในมูลค่าการซื้อรวมของแต่ละประเทศจะสูงกว่าความผันผวนสัมพัทธ์ในมูลค่าการซื้อรวมของทุกประเทศ

ในทำนองเดียวกัน หากปัจจัยอื่นทั้งหมดมีมูลค่าเท่ากัน มูลค่าการซื้อรองเท้าโดยรวมจะต่ำกว่ามูลค่าการซื้อรวมสำหรับสินค้าทั้งหมด (รวมถึงรองเท้า)

ดังนั้น ความผันผวนสัมพัทธ์ในมูลค่าการซื้อรองเท้าทั้งหมดจะสูงกว่าความผันผวนสัมพัทธ์ในมูลค่าการซื้อรวมสำหรับสินค้าทั้งหมด

ผลกระทบนอยส์จากคีย์แบบละเอียดและแบบไม่หยาบ

การสรุปค่าสรุป (ภาพรวม) ยังสรุปข้อมูลที่ได้มา

การรวมค่าสรุปจากรายงานสรุปเพื่อเข้าถึงข้อมูลในระดับที่สูงขึ้น จะช่วยให้คุณสรุปข้อมูลรบกวนจากค่าสรุปเหล่านี้ได้ด้วย

ระดับของสัญญาณรบกวนที่มีแป้นแบบละเอียด กับแป้นแบบหยาบที่ไม่มีปุ่มรวม

เรามาดู 2 แนวทางที่แตกต่างกันกัน - วิธีการ ก: ให้ระบุรหัสภูมิศาสตร์ในคีย์ รายงานสรุปจะแสดงคีย์ระดับรหัสภูมิศาสตร์ โดยแต่ละคีย์จะเชื่อมโยงกับมูลค่าการซื้อโดยสรุปที่ระดับรหัสภูมิศาสตร์ที่เฉพาะเจาะจง - วิธีการ ข: คุณไม่ได้ใส่รหัสภูมิศาสตร์ในคีย์ รายงานสรุปจะแสดงมูลค่าการซื้อโดยสรุปสำหรับรหัสพื้นที่ / สถานที่ตั้งทั้งหมดโดยตรง

วิธีเข้าถึงมูลค่าการซื้อระดับประเทศ - ด้วยวิธีการ A คุณจะรวมค่าสรุประดับรหัสภูมิศาสตร์และรวมค่าที่ได้ ซึ่งมีแนวโน้มที่จะทำให้มูลค่าการซื้อระดับรหัสภูมิศาสตร์สุดท้ายมีความผันผวนมากขึ้น - ใช้วิธีการ ข คุณจะดูข้อมูลที่แสดงในรายงานสรุปได้โดยตรง มีการเพิ่มเสียงรบกวนในข้อมูลนั้นเพียงครั้งเดียว

ดังนั้น มูลค่าการซื้อโดยสรุปสำหรับรหัสภูมิศาสตร์หนึ่งๆ มีแนวโน้มที่จะแสดงเสียงดังได้มากกว่าเมื่อใช้แนวทาง A

ในทำนองเดียวกัน การรวมมิติข้อมูลระดับรหัสไปรษณีย์ไว้ในคีย์ของคุณมีแนวโน้มที่จะทำให้เกิดผลการค้นหาที่มีเสียงดังมากกว่าการใช้คีย์ขนาดหยาบกับมิติข้อมูลระดับภูมิภาค

การรวมในช่วงเวลาที่นานขึ้นจะเพิ่มอัตราส่วนสัญญาณต่อเสียงรบกวน

การขอรายงานสรุปบ่อยน้อยลงหมายความว่าค่าสรุปแต่ละค่ามีแนวโน้มที่จะสูงกว่าการที่คุณขอรายงานบ่อยขึ้น Conversion จะมีโอกาสเกิดขึ้น มากขึ้นในระยะเวลาที่ยาวนานขึ้น

ดังที่กล่าวไว้ก่อนหน้านี้ ยิ่งค่าสรุปสูงเท่าใด ก็ยิ่งมีโอกาสที่สิ่งรบกวนที่เกี่ยวข้องน้อยลงเท่านั้น ดังนั้น การขอรายงานสรุปมักนำไปสู่อัตราส่วนสัญญาณต่อสัญญาณรบกวนที่สูงขึ้น (ดีกว่า)

การขอรายงานสรุปด้วยความถี่น้อยลงจะนำไปสู่อัตราส่วนของสัญญาณต่อสัญญาณรบกวนที่สูงขึ้น

ลองดูตัวอย่างต่อไปนี้

  • หากคุณขอรายงานสรุปรายชั่วโมงนานกว่า 24 ชั่วโมง แล้วสรุปค่าสรุปจากรายงานรายชั่วโมงแต่ละฉบับเพื่อเข้าถึงข้อมูลระดับวัน ข้อมูลรบกวนจะเพิ่มขึ้น 24 ครั้ง
  • ในรายงานสรุปรายวัน 1 ฉบับ ระบบจะเพิ่มสัญญาณรบกวนเพียงครั้งเดียว

Epsilon สูงขึ้น เสียงรบกวนต่ำ

ยิ่งค่าของ Epsilon สูงขึ้นเท่าใด สัญญาณรบกวนก็ยิ่งต่ำลงและการคุ้มครองความเป็นส่วนตัวก็จะยิ่งต่ำลง

การใช้ประโยชน์จากการกรองและการกรองข้อมูลที่ซ้ำกันออก

ส่วนสำคัญของการจัดสรรงบประมาณระหว่างคีย์ต่างๆ คือการทำความเข้าใจจำนวนครั้งที่จะเกิดเหตุการณ์หนึ่งๆ ได้ ตัวอย่างเช่น ผู้ลงโฆษณาอาจสนใจการซื้อเพียงครั้งเดียวสำหรับแต่ละคลิก แต่อาจสนใจ "การดูหน้าผลิตภัณฑ์" สูงสุด 3 รายการ Conversion เพื่อรองรับกรณีการใช้งานเหล่านี้ คุณอาจต้องใช้ประโยชน์จากฟีเจอร์ของ API ต่อไปนี้ที่จะช่วยให้คุณสามารถควบคุมจำนวนรายงานที่จะสร้างขึ้นและ Conversion ที่จะนับ

ทดลองใช้ epsilon

เทคโนโลยีโฆษณาสามารถกำหนดค่า epsilon ให้เป็นค่าที่มากกว่า 0 ขึ้นไปและรวม 64 ได้ โดยช่วงนี้จะช่วยให้ทดสอบได้อย่างยืดหยุ่น ค่าของ epsilon ในระดับต่ำจะช่วยคุ้มครองความเป็นส่วนตัวได้มากขึ้น เราขอแนะนำให้เริ่มต้นด้วย epsilon=10

คำแนะนำในการทดสอบ

เราขอแนะนำให้ทำดังนี้ - เริ่มต้นด้วย epsilon = 10 - ในกรณีที่ทำให้เกิดปัญหาด้านสาธารณูปโภคที่ระบุได้ ให้เพิ่ม epsilon เพิ่มทีละน้อย - แชร์ความคิดเห็นเกี่ยวกับจุดเปลี่ยนผันที่คุณอาจพบเกี่ยวกับความสามารถในการใช้งานข้อมูล

มีส่วนร่วมและแชร์ความคิดเห็น

คุณสามารถเข้าร่วมและทดสอบกับ API นี้

ขั้นตอนถัดไป