গুগল ক্লাউড সার্চ এসডিকে-তে সমস্ত কানেক্টরের জন্য গুগল-প্রদত্ত কনফিগারেশন প্যারামিটার অন্তর্ভুক্ত রয়েছে। এই সেটিংসগুলো সমন্বয় করার মাধ্যমে ডেটা ইন্ডেক্সিং প্রক্রিয়াকে আরও সহজ করা যায়। এই নির্দেশিকায় সাধারণ ইন্ডেক্সিং সমস্যা এবং সেগুলো সমাধানের জন্য প্রয়োজনীয় সেটিংস তালিকাভুক্ত করা হয়েছে।
FullTraversalConnector-এর জন্য কম ইন্ডেক্সিং থ্রুপুট
নিম্নলিখিত সারণিতে একটি FullTraversalConnector এর থ্রুপুট উন্নত করার জন্য সেটিংস তালিকাভুক্ত করা হলো:
| সেটিং | বর্ণনা | ডিফল্ট | প্রস্তাবিত পরিবর্তন |
|---|---|---|---|
traverse.partitionSize | ব্যাচে প্রক্রিয়াকৃত ApiOperation() আইটেমের সংখ্যা। আরও আইটেম আনার আগে SDK একটি পার্টিশন সম্পূর্ণ হওয়ার জন্য অপেক্ষা করে। | ৫০ | আপনার পর্যাপ্ত মেমরি থাকলে ১০০০ বা তার বেশি পর্যন্ত বাড়ান। |
batch.batchSize | একসাথে ব্যাচ করা অনুরোধের সংখ্যা। | ১০ | ব্যাচ সাইজ কমানোর চেষ্টা করুন। |
batch.maxActiveBatches | অনুমোদিত যুগপৎ ব্যাচ সংখ্যা। | ২০ | যদি আপনি batchSize কমান, তাহলে এটি বাড়ানোর জন্য ব্যবহার করুন: (partitionSize / batchSize) + 50 । |
traverse.threadPoolSize | সমান্তরাল প্রক্রিয়াকরণের জন্য থ্রেডের সংখ্যা। | ৫০ | এটিকে ১০-এর গুণিতক দ্বারা বৃদ্ধি করুন। |
ASYNCHRONOUS এবং SYNCHRONOUS API অনুরোধ মোডের মধ্যে পরিবর্তন করতে setRequestMode() ব্যবহার করার কথা বিবেচনা করুন।
ListTraversalConnector-এর জন্য কম ইনডেক্সিং থ্রুপুট
একটি ListTraversalConnector ডিফল্টরূপে একটি ট্র্যাভার্সার ব্যবহার করে। থ্রুপুট বাড়ানোর জন্য, নির্দিষ্ট আইটেম স্ট্যাটাসের (যেমন, NEW_ITEM , MODIFIED ) জন্য একাধিক ট্র্যাভার্সার তৈরি করুন।
| সেটিং | বর্ণনা | ডিফল্ট | পরিবর্তন |
|---|---|---|---|
repository.traversers | স্বতন্ত্র নামসহ (যেমন, t1, t2 ) পৃথক ট্র্যাভার্সার তৈরি করে। | একজন ভ্রমণকারী | আরও ট্র্যাভার্সার যোগ করুন। |
traversers. t1 .hostload | একই সাথে আইটেমগুলো সূচীবদ্ধ করার জন্য থ্রেডের সংখ্যা। | ৫ | ১০ বা তার বেশি মান চেষ্টা করুন। |
schedule.pollQueueIntervalSecs | একটি খালি কিউ পুনরায় পোল করার আগে কয়েক সেকেন্ড অপেক্ষা করতে হয়। | ১০ | ১-এ নামিয়ে আনার চেষ্টা করুন। |
traverser. t1 .pollRequest.statuses | সূচীবদ্ধ করার জন্য স্ট্যাটাস (যেমন, NEW_ITEM )। | সব | বিভিন্ন স্ট্যাটাসের জন্য ভিন্ন ভিন্ন ট্র্যাভার্সার ব্যবহার করুন। |
SDK টাইমআউট বা ইন্টারাপ্ট
বড় ফাইল আপলোড করার সময় টাইমআউট হলে, traverser.timeout= seconds ব্যবহার করে টাইমআউট বাড়িয়ে দিন (ডিফল্ট ৬০ সেকেন্ড)। এছাড়াও আপনি এপিআই রিকোয়েস্ট টাইমআউট বাড়াতে পারেন:
| প্যারামিটার | বর্ণনা | ডিফল্ট |
|---|---|---|
indexingService.connectTimeoutSeconds | এপিআই অনুরোধের জন্য সংযোগের সময়সীমা শেষ। | ১২০ এর দশক |
indexingService.readTimeoutSeconds | এপিআই অনুরোধের জন্য রিড টাইমআউট। | ১২০ এর দশক |