ব্যাচিংয়ের কৌশল,ব্যাচিংয়ের কৌশল,ব্যাচিংয়ের কৌশল,ব্যাচিংয়ের কৌশল

সমষ্টিগত প্রতিবেদনগুলি ব্যাচ করার সময়, ব্যাচিং কৌশলগুলি অপ্টিমাইজ করা গুরুত্বপূর্ণ যাতে গোপনীয়তার সীমা অতিক্রম না হয়৷ অ্যাগ্রিগেশন সার্ভিসে রিপোর্টের ব্যাচ পাঠানোর জন্য নিম্নলিখিত কয়েকটি প্রস্তাবিত কৌশল রয়েছে।

রিপোর্ট সংগ্রহ করুন

একটি ব্যাচে অন্তর্ভুক্ত করার জন্য প্রতিবেদন সংগ্রহ করার সময়, নিম্নলিখিতগুলি মনে রাখবেন:

আপলোড পুনরায় চেষ্টা রিপোর্ট

দ্রষ্টব্য: পুনরায় চেষ্টা করার মানদণ্ড পরিবর্তন সাপেক্ষে। সে ক্ষেত্রে এই বিভাগের তথ্য আপডেট করা হবে।

ওয়েব এবং ওএস উভয় প্ল্যাটফর্মে, একটি প্ল্যাটফর্ম তিনবার রিপোর্ট পাঠানোর চেষ্টা করবে, কিন্তু তৃতীয়বার চেষ্টা করার পরেও যদি রিপোর্ট পাঠানো না হয়, তাহলে এটি পাঠানো হবে না। মূল scheduled_report_time মানটি সংরক্ষিত থাকে না কেন রিপোর্ট পাঠানো যাবে। প্ল্যাটফর্ম প্রতি পুনঃপ্রচারের টাইমলাইন আলাদা:

  • যখন ব্রাউজার অনলাইন থাকে তখন একটি ওয়েব ব্রাউজার রিপোর্ট পাঠাবে। রিপোর্ট পাঠাতে ব্যর্থ হলে, এটি দ্বিতীয় পুনঃপ্রচেষ্টার জন্য পাঁচ মিনিট অপেক্ষা করবে, এবং তারপর তৃতীয়টির জন্য 15 মিনিট অপেক্ষা করবে৷ যদি ব্রাউজারটি অফলাইনে চলে যায়, তাহলে এটি অনলাইনে ফিরে আসার এক মিনিট পরে পরবর্তী পুনরায় চেষ্টা করা হবে। ওয়েবে রিপোর্ট পাঠাতে সর্বোচ্চ বিলম্ব নেই; এর মানে, যদি ব্রাউজারটি অফলাইনে চলে যায়, প্রতিবেদনটি কতদিন আগে তৈরি করা হয়েছে তা বিবেচনা না করে, ব্রাউজারটি একবার অনলাইনে ফিরে গেলে, এটি পুনরায় চেষ্টা করার নীতি অনুসারে প্রতিবেদনটি পাঠানোর চেষ্টা করবে।
  • একটি অ্যান্ড্রয়েড ফোনের একটি ধারাবাহিক নেটওয়ার্ক সংযোগ রয়েছে৷ যেমন, এটি প্রতি ঘন্টায় একবার রিপোর্ট পাঠানোর কাজ চালাবে। এর মানে হল যে যদি একটি রিপোর্ট পাঠাতে ব্যর্থ হয়, এটি পরের ঘন্টায় এবং তার পরের ঘন্টায় আবার চেষ্টা করা হবে। ডিভাইসটির কোনো সংযোগ না থাকলে, ডিভাইসটি আবার নেটওয়ার্কের সাথে সংযোগ করার পর চালানো পরবর্তী রিপোর্টিং কাজের সাথে রিপোর্ট পাঠানোর চেষ্টা করবে। সর্বাধিক বিলম্ব হল 28 দিন, যার মানে ডিভাইসটি 28 দিনের বেশি আগে তৈরি করা রিপোর্ট পাঠাবে না।

রিপোর্টের জন্য অপেক্ষা করুন

ব্যাচিংয়ের জন্য প্রতিবেদন সংগ্রহ করার সময় দেরিতে আসা প্রতিবেদনের জন্য অপেক্ষা করার পরামর্শ দেওয়া হয়। দেরী রিপোর্ট নির্ধারণ করা যেতে পারে যখন রিপোর্টটি প্রাপ্ত হয়েছিল তার বিপরীতে scheduled_report_time মান পরীক্ষা করে। এই রিপোর্টগুলির মধ্যে সময়ের পার্থক্য নির্ধারণ করতে সাহায্য করবে যে আপনি কতক্ষণ দেরীতে আসা রিপোর্টগুলির জন্য অপেক্ষা করতে চান। উদাহরণস্বরূপ, বিলম্বিত প্রতিবেদনগুলি সংগ্রহ করা হলে, scheduled_report_time ক্ষেত্রটি পরীক্ষা করুন এবং 90%, 95%, এবং 99% রিপোর্ট প্রাপ্ত হওয়ার সময় ঘন্টার বিলম্ব নোট করুন। দেরীতে আসা রিপোর্টের জন্য কতক্ষণ অপেক্ষা করতে হবে তা নির্ধারণ করতে সেই ডেটা ব্যবহার করা যেতে পারে। তাত্ক্ষণিক সমষ্টিগত প্রতিবেদনগুলি বিলম্বিত প্রতিবেদনের সম্ভাবনা কমাতে ব্যবহার করা যেতে পারে।

নিম্নলিখিত ভিজ্যুয়াল দেখায় যে দেরিতে আসা রিপোর্টগুলি নির্ধারিত রিপোর্টের সময় অনুযায়ী উপযুক্ত ব্যাচে সংরক্ষণ করা হচ্ছে। ব্যাচ T scheduled_report_time প্রতিনিধিত্ব করে, এবং T+X বিলম্বিত প্রতিবেদনের জন্য অপেক্ষা করা সময়ের প্রতিনিধিত্ব করে। এটি একটি সংক্ষিপ্ত প্রতিবেদনে পরিণত হয় যা ব্যাচে অন্তর্ভুক্ত বেশিরভাগ প্রতিবেদনগুলিকে অন্তর্ভুক্ত করে যা তাদের নির্ধারিত প্রতিবেদনের সময়ের সাথে মিলে যায়।

ব্যাচিং

সমষ্টিগত প্রতিবেদন অ্যাকাউন্টিং

একত্রিতকরণ পরিষেবা একটি "কোন নকল নেই" নিয়ম বজায় রাখে৷ এই নিয়মটি প্রয়োগ করে যে একই ভাগ করা আইডি সহ সমস্ত সমষ্টিগত প্রতিবেদন একই ব্যাচে অন্তর্ভুক্ত করতে হবে।

প্রতিবেদনগুলি সংগ্রহ করার পরে, সেগুলিকে এমনভাবে ব্যাচ করা উচিত যাতে একই ভাগ করা আইডি সহ সমস্ত প্রতিবেদন একটি ব্যাচের অংশ হয়।

যদি একটি প্রতিবেদন ইতিমধ্যেই অন্য ব্যাচে প্রক্রিয়া করা হয়ে থাকে, তবে প্রক্রিয়াকরণের ফলে একটি গোপনীয়তা বাজেট নিঃশেষিত ত্রুটি হতে পারে। ব্যাচিং রিপোর্টগুলি সঠিকভাবে "কোন নকল নেই" নিয়মের কারণে ব্যাচগুলিকে প্রত্যাখ্যান করা থেকে আটকাতে সাহায্য করে৷

একটি শেয়ার্ড আইডি হল একটি কী যা প্রতিটি রিপোর্টের জন্য তৈরি করা হয় সমষ্টিগত রিপোর্ট অ্যাকাউন্টিং ট্র্যাক করার জন্য। শেয়ার্ড আইডি নিশ্চিত করে যে একই শেয়ার করা আইডির রিপোর্ট শুধুমাত্র একটি সারাংশ রিপোর্টে অবদান রাখে। এর মানে হল যে রিপোর্টগুলি একটি শেয়ার্ড আইডিতে একসাথে ম্যাপ করে সেগুলিকে অবশ্যই একটি একক ব্যাচে অন্তর্ভুক্ত করতে হবে৷ উদাহরণ স্বরূপ, যদি রিপোর্ট X এবং রিপোর্ট Y উভয়েরই একই শেয়ার্ড আইডি থাকে, তাহলে ডুপ্লিকেশনের জন্য রিপোর্ট বাদ দেওয়া এড়াতে তাদের অবশ্যই একই ব্যাচে অন্তর্ভুক্ত করতে হবে।

নিম্নলিখিত চিত্রটি shared_info উপাদানগুলি প্রদর্শন করে যা একটি শেয়ার্ড আইডি তৈরি করতে একসাথে হ্যাশ করা হয়।

শেয়ার্ড-আইডি

নিম্নলিখিত চিত্রটি দেখায় কিভাবে দুটি ভিন্ন প্রতিবেদনে একই ভাগ করা আইডি থাকতে পারে:

নির্ধারিত-রিপোর্ট-সময়

দ্রষ্টব্য: scheduled_report_time ঘন্টা দ্বারা কাটা হয়, এবং source_registration_time দিন দ্বারা কাটা হয়। উপরন্তু, শেয়ার করা আইডি তৈরিতে report_id ব্যবহার করা হয় না। সময়ের গ্রানুলারিটি ভবিষ্যতে আপডেট করা হতে পারে।

ব্যাচের মধ্যে ডুপ্লিকেট রিপোর্ট

একটি সমষ্টিগত প্রতিবেদনের shared_info ফিল্ডে report_id ফিল্ডে একটি UUID থাকে, যা একটি ব্যাচের মধ্যে ডুপ্লিকেট রিপোর্ট শনাক্ত করতে ব্যবহৃত হয়। যদি একটি ব্যাচে একই report_id সহ একাধিক প্রতিবেদন থাকে, তবে শুধুমাত্র প্রথম প্রতিবেদনটি একত্রিত করা হবে, এবং অন্যগুলি সদৃশ হিসাবে বিবেচিত হবে এবং নীরবে বাদ দেওয়া হবে; সমষ্টি স্বাভাবিক হিসাবে এগিয়ে যাবে এবং কোন ত্রুটি পাঠানো হবে না. যদিও প্রয়োজন নেই, বিজ্ঞাপন প্রযুক্তি একত্রিত হওয়ার আগে একই রিপোর্ট আইডি সহ ডুপ্লিকেট রিপোর্টগুলি ফিল্টার করে কিছু কর্মক্ষমতা লাভের আশা করতে পারে।

report_id প্রতিটি রিপোর্টের জন্য অনন্য।

ব্যাচ জুড়ে ডুপ্লিকেট রিপোর্ট

প্রতিটি প্রতিবেদনে একটি শেয়ার্ড আইডি বরাদ্দ করা হয়, যা রিপোর্টের shared_info ফিল্ড থেকে আসা সম্মিলিত ডেটা পয়েন্ট থেকে তৈরি একটি আইডি। একাধিক রিপোর্টে একই শেয়ার করা আইডি থাকতে পারে এবং প্রতিটি ব্যাচে একাধিক শেয়ার করা আইডি থাকতে পারে। একই শেয়ার্ড আইডি সহ সমস্ত রিপোর্ট একই ব্যাচে যেতে হবে। একই শেয়ার্ড আইডি সহ রিপোর্টগুলি একাধিক ব্যাচে শেষ হলে, শুধুমাত্র প্রথম ব্যাচটি গ্রহণ করা হবে এবং অন্যগুলি সদৃশ হিসাবে প্রত্যাখ্যান করা হবে৷ এটি প্রতিরোধ করার জন্য, ব্যাচগুলি যথাযথভাবে তৈরি করতে হবে

নিম্নলিখিত চিত্রটি একটি উদাহরণ দেখায় যেখানে ব্যাচ জুড়ে একই ভাগ করা আইডি সহ রিপোর্টগুলি পরবর্তী ব্যাচ ব্যর্থ হতে পারে৷ ছবিতে, আপনি দেখতে পাচ্ছেন যে একই শেয়ার্ড আইডি e679aa সহ দুই বা ততোধিক রিপোর্ট বিভিন্ন ব্যাচে #1 এবং #2 এ ব্যাচ করা হয়েছে। যেহেতু শেয়ার করা আইডি e679aa সহ সমস্ত রিপোর্টের বাজেট ব্যাচ #1 সারাংশ রিপোর্ট তৈরির সময় খরচ হয়, ব্যাচ #2 অনুমোদিত নয় এবং একটি ত্রুটি সহ ব্যর্থ হয়।

নকল

ব্যাচ রিপোর্ট

ডুপ্লিকেট এড়াতে এবং সামগ্রিক রিপোর্ট অ্যাকাউন্টিং অপ্টিমাইজ করার জন্য রিপোর্টগুলি ব্যাচ করার জন্য নিম্নলিখিতগুলি সুপারিশ করা হয়েছে৷

বিজ্ঞাপনদাতা দ্বারা ব্যাচ

দ্রষ্টব্য: এই কৌশলটি শুধুমাত্র অ্যাট্রিবিউশন রিপোর্টিং সমষ্টির জন্য সুপারিশ করা হয়।

প্রাইভেট অ্যাগ্রিগেশনের কোনো attribution_destination ক্ষেত্র নেই, যেটি বিজ্ঞাপনদাতা। এটি বিজ্ঞাপনদাতা দ্বারা ব্যাচ করার সুপারিশ করা হয়, যার অর্থ একই ব্যাচে একজন একক বিজ্ঞাপনদাতার অন্তর্গত প্রতিবেদনগুলি অন্তর্ভুক্ত করা, প্রতিটি ব্যাচের জন্য সমষ্টিগত প্রতিবেদন অ্যাকাউন্টের সীমাকে আঘাত করা এড়াতে। বিজ্ঞাপনদাতা হল শেয়ার্ড আইডি তৈরির ক্ষেত্রে বিবেচিত একটি ক্ষেত্র, তাই একই বিজ্ঞাপনদাতার রিপোর্টেও একই শেয়ার করা আইডি থাকতে পারে, যাতে ত্রুটি এড়াতে তাদের একই ব্যাচে থাকতে হবে।

সময় অনুযায়ী ব্যাচ

ব্যাচ করার সময় রিপোর্টের নির্ধারিত রিপোর্টের সময় ( shared_info.scheduled_report_time ) বিবেচনা করার পরামর্শ দেওয়া হয়। শেয়ার্ড আইডি জেনারেশনে নির্ধারিত রিপোর্টের সময় ঘন্টায় কাটা হয়, তাই ন্যূনতম রিপোর্টগুলি ঘন্টার ব্যবধানে ব্যাচ করা উচিত, যার অর্থ একই শেয়ার করা রিপোর্টগুলি এড়াতে একই ঘন্টার মধ্যে নির্ধারিত রিপোর্টের সময় সহ সমস্ত রিপোর্ট একই ব্যাচে যাওয়া উচিত। একাধিক ব্যাচ জুড়ে আইডি, যা কাজের ত্রুটির দিকে পরিচালিত করবে।

ব্যাচ ফ্রিকোয়েন্সি এবং গোলমাল

কত ঘন ঘন সমষ্টিগত প্রতিবেদনগুলি প্রক্রিয়া করা হয় তার উপর গোলমালের প্রভাব বিবেচনা করার পরামর্শ দেওয়া হয়। যদি সমষ্টিগত প্রতিবেদনগুলি আরও ঘন ঘন ব্যাচ করা হয়-উদাহরণস্বরূপ, প্রতিবেদনগুলি একবার প্রক্রিয়া করা হয়-এক ঘন্টা-কম রূপান্তর ইভেন্টগুলি অন্তর্ভুক্ত করা হবে এবং গোলমাল একটি বড় আপেক্ষিক প্রভাব ফেলবে। যদি ফ্রিকোয়েন্সি হ্রাস করা হয় এবং প্রতিবেদনগুলি সপ্তাহে একবার প্রক্রিয়া করা হয়, তবে শব্দের একটি ছোট আপেক্ষিক প্রভাব পড়বে। ব্যাচগুলিতে শব্দের প্রভাব আরও ভালভাবে বোঝার জন্য, নয়েজ ল্যাবের সাথে পরীক্ষা করুন।