সংযোগকারী সেটিংস টিউন করুন

গুগল ক্লাউড সার্চ এসডিকে-তে সমস্ত কানেক্টরের জন্য গুগল-প্রদত্ত কনফিগারেশন প্যারামিটার অন্তর্ভুক্ত রয়েছে। এই সেটিংসগুলো সমন্বয় করার মাধ্যমে ডেটা ইন্ডেক্সিং প্রক্রিয়াকে আরও সহজ করা যায়। এই নির্দেশিকায় সাধারণ ইন্ডেক্সিং সমস্যা এবং সেগুলো সমাধানের জন্য প্রয়োজনীয় সেটিংস তালিকাভুক্ত করা হয়েছে।

FullTraversalConnector-এর জন্য কম ইন্ডেক্সিং থ্রুপুট

নিম্নলিখিত সারণিতে একটি FullTraversalConnector এর থ্রুপুট উন্নত করার জন্য সেটিংস তালিকাভুক্ত করা হলো:

সেটিং বর্ণনা ডিফল্ট প্রস্তাবিত পরিবর্তন
traverse.partitionSize ব্যাচে প্রক্রিয়াকৃত ApiOperation() আইটেমের সংখ্যা। আরও আইটেম আনার আগে SDK একটি পার্টিশন সম্পূর্ণ হওয়ার জন্য অপেক্ষা করে। ৫০ আপনার পর্যাপ্ত মেমরি থাকলে ১০০০ বা তার বেশি পর্যন্ত বাড়ান।
batch.batchSize একসাথে ব্যাচ করা অনুরোধের সংখ্যা। ১০ ব্যাচ সাইজ কমানোর চেষ্টা করুন।
batch.maxActiveBatches অনুমোদিত যুগপৎ ব্যাচ সংখ্যা। ২০ যদি আপনি batchSize কমান, তাহলে এটি বাড়ানোর জন্য ব্যবহার করুন: (partitionSize / batchSize) + 50
traverse.threadPoolSize সমান্তরাল প্রক্রিয়াকরণের জন্য থ্রেডের সংখ্যা। ৫০ এটিকে ১০-এর গুণিতক দ্বারা বৃদ্ধি করুন।

ASYNCHRONOUS এবং SYNCHRONOUS API অনুরোধ মোডের মধ্যে পরিবর্তন করতে setRequestMode() ব্যবহার করার কথা বিবেচনা করুন।

ListTraversalConnector-এর জন্য কম ইনডেক্সিং থ্রুপুট

একটি ListTraversalConnector ডিফল্টরূপে একটি ট্র্যাভার্সার ব্যবহার করে। থ্রুপুট বাড়ানোর জন্য, নির্দিষ্ট আইটেম স্ট্যাটাসের (যেমন, NEW_ITEM , MODIFIED ) জন্য একাধিক ট্র্যাভার্সার তৈরি করুন।

সেটিং বর্ণনা ডিফল্ট পরিবর্তন
repository.traversers স্বতন্ত্র নামসহ (যেমন, t1, t2 ) পৃথক ট্র্যাভার্সার তৈরি করে। একজন ভ্রমণকারী আরও ট্র্যাভার্সার যোগ করুন।
traversers. t1 .hostload একই সাথে আইটেমগুলো সূচীবদ্ধ করার জন্য থ্রেডের সংখ্যা। ১০ বা তার বেশি মান চেষ্টা করুন।
schedule.pollQueueIntervalSecs একটি খালি কিউ পুনরায় পোল করার আগে কয়েক সেকেন্ড অপেক্ষা করতে হয়। ১০ ১-এ নামিয়ে আনার চেষ্টা করুন।
traverser. t1 .pollRequest.statuses সূচীবদ্ধ করার জন্য স্ট্যাটাস (যেমন, NEW_ITEM )। সব বিভিন্ন স্ট্যাটাসের জন্য ভিন্ন ভিন্ন ট্র্যাভার্সার ব্যবহার করুন।

SDK টাইমআউট বা ইন্টারাপ্ট

বড় ফাইল আপলোড করার সময় টাইমআউট হলে, traverser.timeout= seconds ব্যবহার করে টাইমআউট বাড়িয়ে দিন (ডিফল্ট ৬০ সেকেন্ড)। এছাড়াও আপনি এপিআই রিকোয়েস্ট টাইমআউট বাড়াতে পারেন:

প্যারামিটার বর্ণনা ডিফল্ট
indexingService.connectTimeoutSeconds এপিআই অনুরোধের জন্য সংযোগের সময়সীমা শেষ। ১২০ এর দশক
indexingService.readTimeoutSeconds এপিআই অনুরোধের জন্য রিড টাইমআউট। ১২০ এর দশক