সংক্ষিপ্ত প্রতিবেদনে গোলমাল বোঝা

গোলমালের অর্থ কী, কোথায় এটি যোগ করা হয় এবং এটি আপনার পরিমাপের প্রচেষ্টাকে কীভাবে প্রভাবিত করে তা জানুন।

সংক্ষিপ্ত প্রতিবেদনগুলি সমষ্টিগত প্রতিবেদনের সমষ্টির ফলাফল। যখন সমষ্টিগত প্রতিবেদনগুলি একটি সংগ্রাহক দ্বারা ব্যাচ করা হয় এবং একত্রীকরণ পরিষেবা দ্বারা প্রক্রিয়া করা হয়, তখন গোলমাল - একটি এলোমেলো পরিমাণ ডেটা - ফলাফলের সারাংশ প্রতিবেদনগুলিতে যোগ করা হয়। ব্যবহারকারীর গোপনীয়তা রক্ষা করতে নয়েজ যোগ করা হয়েছে। এই প্রক্রিয়াটির লক্ষ্য হল একটি কাঠামো যা পৃথকভাবে ব্যক্তিগত পরিমাপকে সমর্থন করতে পারে।

গোলমাল চূড়ান্ত সারাংশ রিপোর্ট যোগ করা হয়.

সংক্ষিপ্ত প্রতিবেদনে গোলমালের ভূমিকা

যদিও শব্দ যোগ করা সাধারণত বিজ্ঞাপন পরিমাপের একটি অংশ নয়, অনেক ক্ষেত্রে যোগ করা শব্দটি আপনার ফলাফলগুলিকে কীভাবে ব্যাখ্যা করবেন তা উল্লেখযোগ্যভাবে পরিবর্তন করবে না।

এটি নিম্নলিখিত উপায়ে এটি সম্পর্কে চিন্তা করতে সাহায্য করতে পারে: যদি সেই ডেটা গোলমাল না হয় তবে আপনি কি একটি নির্দিষ্ট ডেটার উপর ভিত্তি করে সিদ্ধান্ত নিতে আত্মবিশ্বাসী হবেন?

উদাহরণ স্বরূপ, প্রচারাভিযান A-এর 15টি রূপান্তর এবং ক্যাম্পেইন B-এর 16টি ছিল তার উপর ভিত্তি করে, একজন বিজ্ঞাপনদাতা কি তাদের প্রচারাভিযানের কৌশল বা বাজেট পরিবর্তন করতে আত্মবিশ্বাসী হবেন?

যদি উত্তর না হয়, গোলমাল অপ্রাসঙ্গিক।

আপনি যা করতে চান তা হল আপনার API ব্যবহারকে এমনভাবে কনফিগার করুন যে:

  1. উপরের প্রশ্নের উত্তর হ্যাঁ।
  2. গোলমাল এমনভাবে পরিচালিত হয় যা নির্দিষ্ট ডেটার উপর ভিত্তি করে সিদ্ধান্ত নেওয়ার আপনার ক্ষমতাকে উল্লেখযোগ্যভাবে প্রভাবিত করে না। আপনি নিম্নরূপ এটির সাথে যোগাযোগ করতে পারেন: প্রত্যাশিত ন্যূনতম সংখ্যক রূপান্তরের জন্য, আপনি সংগৃহীত মেট্রিকে একটি নির্দিষ্ট % এর নিচে গোলমাল রাখতে চান।

এই বিভাগে এবং নিম্নলিখিত, আমরা 2 অর্জনের কৌশলগুলির রূপরেখা দেব।

মূল ধারণা

একত্রীকরণ পরিষেবা প্রতিটি সারাংশের মানের সাথে একবার শব্দ যোগ করে—অর্থাৎ, প্রতি কী-একবার-প্রতিবারই একটি সারাংশ প্রতিবেদনের অনুরোধ করা হয়।

এই শব্দের মানগুলি এলোমেলোভাবে একটি নির্দিষ্ট সম্ভাব্যতা বন্টন থেকে আঁকা হয়, নীচে আলোচনা করা হয়েছে।

শব্দ প্রভাবিত করে এমন সমস্ত উপাদান দুটি প্রাথমিক ধারণার উপর নির্ভর করে।

  1. সারাংশ মান, কম বা উচ্চ নির্বিশেষে গোলমাল বিতরণ ( নিচে বিশদ বিবরণ ) একই। অতএব, সারাংশের মান যত বেশি হবে, এই মানের তুলনায় শব্দের প্রভাব তত কম হবে।

    উদাহরণ স্বরূপ, ধরে নিন $20,000 এর মোট একত্রিত ক্রয় মূল্য এবং $200 এর মোট ক্রয় মূল্য উভয়ই একই বন্টন থেকে নির্বাচিত গোলমালের সাপেক্ষে।

    ধরা যাক এই বন্টন থেকে আওয়াজ মোটামুটিভাবে -100 এবং +100 এর মধ্যে পরিবর্তিত হয়।

    • $20,000 এর সারাংশ ক্রয় মূল্যের জন্য, শব্দ 0 এবং 100/20,000 = 0.5% এর মধ্যে পরিবর্তিত হয়।
    • $200 এর সংক্ষিপ্ত ক্রয় মূল্যের জন্য, গোলমাল 0 এবং 100/200 = 50% এর মধ্যে পরিবর্তিত হয়।

    অতএব, গোলমাল $200 মূল্যের তুলনায় $20,000 সমষ্টিগত ক্রয় মূল্যের উপর কম প্রভাব ফেলতে পারে। তুলনামূলকভাবে বলতে গেলে, $20,000 কম শোরগোল হওয়ার সম্ভাবনা, অর্থাৎ এটি উচ্চতর সংকেত-থেকে-শব্দ অনুপাতের সম্ভাবনা রয়েছে৷

    উচ্চ সমষ্টিগত মান তুলনামূলকভাবে কম শব্দ প্রভাব আছে.

    এর কয়েকটি গুরুত্বপূর্ণ ব্যবহারিক প্রভাব রয়েছে যা পরবর্তী বিভাগে বর্ণিত হয়েছে। এই প্রক্রিয়াটি API ডিজাইনের অংশ, এবং ব্যবহারিক প্রভাব দীর্ঘমেয়াদী। বিজ্ঞাপন প্রযুক্তি যখন বিভিন্ন একত্রীকরণ কৌশল ডিজাইন এবং মূল্যায়ন করে তখন তারা একটি গুরুত্বপূর্ণ ভূমিকা পালন করতে থাকবে।

  2. যদিও সারাংশের মান নির্বিশেষে একই বন্টন থেকে গোলমাল টানা হয়, সেই বন্টনটি বিভিন্ন পরামিতির উপর নির্ভর করে। এই পরামিতিগুলির মধ্যে একটি, এপিসিলন , বিভিন্ন ইউটিলিটি/গোপনীয়তা সমন্বয়গুলি মূল্যায়ন করার জন্য সমাপ্ত অরিজিন ট্রায়ালের সময় বিজ্ঞাপন প্রযুক্তি দ্বারা পরিবর্তন করা যেতে পারে। যাইহোক, সাময়িক হিসাবে epsilon tweak করার ক্ষমতা বিবেচনা করুন. আমরা আপনার ব্যবহারের ক্ষেত্রে এবং এপিসিলনের মানগুলি সম্পর্কে আপনার প্রতিক্রিয়াকে স্বাগত জানাই যা ভাল কাজ করে।

যদিও একটি বিজ্ঞাপন প্রযুক্তি কোম্পানি শব্দ যোগ করার উপায়গুলির সরাসরি নিয়ন্ত্রণে নয়, এটি তার পরিমাপের ডেটাতে শব্দের প্রভাবকে প্রভাবিত করতে পারে। পরবর্তী বিভাগগুলিতে, আমরা কীভাবে শব্দকে অনুশীলনে প্রভাবিত করতে পারে তা নিয়ে আলোচনা করব।

আমরা করার আগে, আসুন শব্দ প্রয়োগ করার উপায়টি ঘনিষ্ঠভাবে দেখে নেওয়া যাক।

জুম ইন: কিভাবে শব্দ প্রয়োগ করা হয়

এক গোলমাল বিতরণ

নিম্নলিখিত পরামিতি সহ ল্যাপ্লেস ডিস্ট্রিবিউশন থেকে আওয়াজ টানা হয়:

  • 0 এর গড় ( μ )। এর মানে হল সবচেয়ে সম্ভাব্য শব্দের মান হল 0 (কোনও শব্দ যোগ করা হয়নি), এবং গোলমালের মানটি আসল থেকে ছোট হওয়ার সম্ভাবনা যতটা বড় হবে (এটিকে কখনও কখনও নিরপেক্ষ বলা হয় )
  • b = CONTRIBUTION_BUDGET / epsilon একটি স্কেল প্যারামিটার
    • CONTRIBUTION_BUDGET ব্রাউজারে সংজ্ঞায়িত করা হয়েছে৷
    • epsilon সমষ্টি সার্ভারে স্থির করা হয়.

নিম্নলিখিত চিত্রটি μ=0, b = 20 সহ একটি ল্যাপ্লেস ডিস্ট্রিবিউশনের জন্য সম্ভাব্যতা ঘনত্ব ফাংশন দেখায়:

μ=0, b = 20 সহ একটি ল্যাপ্লেস ডিস্ট্রিবিউশনের জন্য সম্ভাব্যতা ঘনত্ব ফাংশন

এলোমেলো শব্দের মান, একটি শব্দ বিতরণ

ধরা যাক যে একটি বিজ্ঞাপন প্রযুক্তি দুটি সমষ্টি কী, key1 এবং key2-এর জন্য সারাংশ প্রতিবেদনের অনুরোধ করে।

অ্যাগ্রিগেশন সার্ভিস একই নয়েজ ডিস্ট্রিবিউশন অনুসরণ করে দুটি নয়েজ মান x1 এবং x2 নির্বাচন করে। key1-এর সারাংশের মানের সাথে x1 যোগ করা হয় এবং key2-এর সারাংশের মানের সঙ্গে x2 যোগ করা হয়।

ডায়াগ্রামে, আমরা শব্দের মানগুলিকে অভিন্ন হিসাবে উপস্থাপন করব। এটি একটি সরলীকরণ; বাস্তবে, শব্দের মানগুলি পরিবর্তিত হবে, কারণ সেগুলি বিতরণ থেকে এলোমেলোভাবে আঁকা হয়েছে৷

এটি ব্যাখ্যা করে যে গোলমালের মানগুলি একই বন্টন থেকে আসে এবং তারা যে সারাংশের মান প্রয়োগ করা হয় তা থেকে স্বাধীন।

শব্দের অন্যান্য বৈশিষ্ট্য

গোলমাল প্রতিটি সারাংশ মান প্রয়োগ করা হয় - খালি (0) সহ।

এমনকি খালি সারাংশ মান গোলমাল সাপেক্ষে.

উদাহরণস্বরূপ, একটি প্রদত্ত কী-এর প্রকৃত সারাংশের মান 0 হলেও, এই কীটির সারাংশ প্রতিবেদনে আপনি যে শোরগোলপূর্ণ সারাংশ মান দেখতে পাবেন তা (সম্ভবত) 0 হবে না।

গোলমাল একটি ধনাত্মক বা ঋণাত্মক সংখ্যা হতে পারে।

ইতিবাচক এবং নেতিবাচক শব্দের উদাহরণ।

উদাহরণস্বরূপ, 327,000-এর প্রাক-আওয়াজ ক্রয়ের পরিমাণের জন্য, নয়েজ +6,000 বা -6,000 হতে পারে (এগুলি নির্বিচারে উদাহরণ মান)।

গোলমাল মূল্যায়ন

গোলমালের মানক বিচ্যুতি গণনা করা

গোলমালের আদর্শ বিচ্যুতি হল:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
উদাহরণ

এপিসিলন = 10 এর সাথে, শব্দের মানক বিচ্যুতি হল:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

যখন পরিমাপের পার্থক্য তাৎপর্যপূর্ণ হয় তখন মূল্যায়ন করা

যেহেতু আপনি সমষ্টি পরিষেবা দ্বারা প্রতিটি মান আউটপুটে যোগ করা গোলমালের মানক বিচ্যুতি জানতে পারবেন, আপনি গোলমালের কারণে পর্যবেক্ষণ করা পার্থক্যগুলি হতে পারে কিনা তা নির্ধারণ করতে তুলনা করার জন্য উপযুক্ত থ্রেশহোল্ড নির্ধারণ করতে পারেন।

উদাহরণস্বরূপ, যদি একটি মানের সাথে যোগ করা শব্দটি প্রায় +/- 10 (স্কেলিংয়ের জন্য অ্যাকাউন্টিং) হয় এবং দুটি প্রচারাভিযানের মধ্যে মানের পার্থক্য 100-এর বেশি হয়, তাহলে এই সিদ্ধান্তে আসা নিরাপদ যে প্রতিটি প্রচারাভিযানের মধ্যে পরিমাপ করা মানের পার্থক্য একা গোলমালের কারণে নয়।

Engage and share feedback

You can participate and experiment with this API.

পরবর্তী পদক্ষেপ