يشتمل كل موصل على ملف تهيئة مرتبط يحتوي على المعلمات التي يستخدمها الموصل،
مثل رقم تعريف المستودع. يتم تعريف المَعلمات على أنّها أزواج من قيم المفتاح/القيمة، مثل
api.sourceId=1234567890abcdef
تحتوي حزمة تطوير البرامج (SDK) لخدمة Google Cloud Search على العديد من الإعدادات التي توفّرها Google. المعاملات التي تستخدمها موصلات مختلفة. من بين مَعلمات الإعداد التي توفّرها Google، كما يتعيّن تحديد مَعلمات الوصول إلى مصدر البيانات فقط في ملف الإعداد. لن تحتاج إلى إعادة تحديد المعلمات التي توفرها Google في ملف الضبط إلا إذا أردت إلغاء القيم التلقائية.
يصِف هذا المرجع مَعلمات الإعداد التي توفّرها Google.
مثال على ملف الإعداد
يوضّح المثال التالي ملف إعداد هوية يشتمل على أزواج المفتاح/القيمة الخاصة بالمَعلمة.
# # Configuration file sample # api.sourceId=1234567890abcdef api.identitySourceId=0987654321lmnopq api.serviceAccountPrivateKeyFile= ./PrivateKey.json # # Traversal schedules # schedule.traversalIntervalSecs=7200 schedule.incrementalTraversalIntervalSecs=600 # # Default ACLs # defaultAcl.mode=fallback defaultAcl.public=true
المَعلمات الشائعة
يسرد هذا القسم مَعلمات الضبط المطلوبة والاختيارية التي يتم ضبطها بشكل شائع. إذا لم تغيير القيم للمعلمات الاختيارية، يستخدم الموصل القيم الافتراضية التي تقدمها حزمة SDK.
الوصول إلى مصدر البيانات
يسرد الجدول التالي جميع المَعلمات المطلوبة للظهور في أحد الإعدادات. الملف. تعتمد المعلمات التي تستخدمها على نوع الموصّل الذي تنشئه (أداة ربط المحتوى). أو موصِّل الهوية).
الإعدادات | المعلمة |
---|---|
رقم تعريف مصدر البيانات | api.sourceId=1234567890abcdef
تشترط الموصل هذه المعلمة لتحديد موقع المستودع. تحصل على هذه القيمة عندما إضافة مصدر بيانات إلى البحث يجب أن تكون هذه المَعلمة في ملفات ضبط المُوصِّل. |
رقم تعريف مصدر الهوية | api.identitySourceId=0987654321lmnopq
هذه المَعلمة مطلوبة من خلال موصِّلات الهوية لتحديد موقع مصدر هوية خارجي. لقد حصلت على هذه القيمة عندما ربط هويات المستخدمين في Cloud Search يجب أن تكون هذه المَعلمة في جميع ملفات إعداد موصِّلات الهوية. |
ملف المفتاح الخاص لحساب الخدمة | api.serviceAccountPrivateKeyFile=./PrivateKey.json
تحتوي هذه المعلمة على المفتاح الخاص المطلوب من الوصول إلى المستودع. لقد حصلت على هذه القيمة عندما تم إعداد الوصول إلى Google Cloud Search REST API. يجب أن تكون هذه المعلمة في جميع ملفات الإعداد. |
رقم تعريف حساب الخدمة | api.serviceAccountId=123abcdef4567890
تحدّد هذه المَعلمة حساب الخدمة. رقم التعريف يُسمح باستخدام قيمة السلسلة الفارغة التلقائية فقط عندما يتضمّن ملف الإعداد. يحدد معلمة ملف المفتاح الخاص. هذه المعلمة مطلوبة إذا كان ملف المفتاح الخاص ليس مفتاح JSON. |
رقم تعريف حساب Google Workspace | api.customerId=123abcdef4567890
تحدّد هذه المَعلمة رقم تعريف الحساب لحساب المؤسسة على Google Workspace. لقد حصلت على هذه القيمة عند ربط المستخدم الهويات في Cloud Search هذه المعلمة مطلوبة عند مزامنة المستخدمين باستخدام موصِّل الهوية. |
عنوان URL الجذر | api.rootUrl=baseURLPath
تحدّد هذه المَعلمة مسار عنوان URL لقاعدة خدمة الفهرسة. والقيمة الافتراضية لهذه المعلمة هي سلسلة فارغة يتم تحويلها إلى
|
الجداول الزمنية للاجتياز
تحدد معلمات الجدولة عدد مرات انتظار الموصل بين واجتيازات الاختبار.
الإعدادات | المعلمة |
---|---|
الاجتياز الكامل عند بدء تشغيل الموصل | schedule.performTraversalOnStart=true|false
يُجري الموصل اجتيازًا كاملاً عند بدء تشغيل الموصل، بدلاً من
في انتظار انتهاء الفاصل الزمني الأول. القيمة التلقائية هي |
الاجتياز الكامل بعد فاصل زمني | schedule.traversalIntervalSecs=intervalInSeconds
يُجري الموصل عملية اجتياز كاملة بعد فاصل زمني محدد. تحديد
الفاصل الزمني بين عمليات الاجتياز بالثواني. القيمة التلقائية هي |
الخروج بعد اجتياز واحد | connector.runOnce=true|false
يُجري الموصل اجتيازًا كاملاً مرة واحدة، ثم يخرج. يجب أن تقتصر هذه المعلمة
أن يتم ضبطها على |
اجتياز متزايد بعد فاصل زمني | schedule.incrementalTraversalIntervalSecs=intervalInSeconds
يقوم الموصل بإجراء اجتياز تزايدي بعد فاصل محدد.
تحديد الفاصل الزمني بين عمليات الاجتياز بالثواني القيمة الافتراضية هي
|
الفواصل الزمنية المجدوَلة لقائمة الاستطلاع | schedule.pollQueueIntervalSecs=interval_in_seconds
الفاصل الزمني بين الفواصل الزمنية المجدولة مسبقًا لقائمة الاستطلاع (بالثواني). يتم استخدام هذه المعلومات
من خلال موصل اجتياز بطاقة بيانات المتجر فقط. القيمة التلقائية هي |
قوائم التحكّم بالوصول
يتحكم الموصل في الوصول إلى العناصر باستخدام قوائم التحكم في الوصول. معلمات متعددة بحماية وصول المستخدم إلى السجلات المفهرسة باستخدام قوائم التحكم في الوصول.
إذا كان المستودع يحتوي على معلومات فردية لقائمة التحكم بالوصول مرتبطة بكل عنصر، تحميل جميع معلومات قائمة التحكم بالوصول (ACL) للتحكُّم في الوصول إلى العناصر داخل Cloud Search. في حال حذف يوفر مستودعك معلومات جزئية أو لا توفر معلومات قائمة التحكم بالوصول، فيمكنك تقديم معلومات قائمة التحكم بالوصول (ACL) في المعلمات التالية، والتي توفرها حزمة SDK وصلة البيانات.
الإعدادات | المعلمة |
---|---|
وضع ACL | defaultAcl.mode=mode
يحدد وقت تطبيق قائمة التحكم بالوصول الافتراضية. قيم صالحة:
الوضع التلقائي هو |
ACL العلني التلقائي | defaultAcl.public=true|false
يتم تعيين قائمة التحكم بالوصول الافتراضية المستخدمة للمستودع بأكمله إلى الوصول إلى النطاق العام.
القيمة التلقائية هي |
برامج القراءة الشائعة لمجموعة ACL | defaultAcl.readers.groups=google:group1@mydomain.com,
group2 |
برامج قراءة ACL الشائعة | defaultAcl.readers.users=user1, user2,
google:user3@mydomain.com |
قراء المجموعات الذين تم رفضهم لقائمة ACL الشائعة | defaultAcl.denied.groups=group3 |
القرّاء الذين تم رفضهم في سياسة Acl الشائعة | defaultAcl.denied.users=user4, user5 |
الوصول الكامل إلى النطاق | لتحديد إمكانية وصول جميع المستخدمين إلى كل سجلّ مُفهرَس
في المجال، قم بتعيين المعاملين التاليين مع القيم:
|
قائمة التحكم بالوصول المحددة (ACL) الشائعة | لتحديد قائمة واحدة للتحكم في الوصول لكل سجل من سجلات مستودع البيانات، قم بتعيين جميع
قيم المعلّمات التالية:
|
مَعلمات ضبط البيانات الوصفية
بعض البيانات الوصفية للعنصر قابلة للتهيئة. يمكن للموصلات تعيين حقول بيانات وصفية قابلة للتهيئة أثناء الفهرسة. إذا لم يضبط الموصِّل حقلاً، يتم استخدام المَعلمات في ملف الإعداد. لضبط المجال.
يتضمن ملف الإعداد سلسلة من مَعلمات إعداد البيانات الوصفية المُسمّاة المُشار إليها باستخدام
لاحقة .field
، مثل
itemMetadata.title.field=movieTitle
إذا كانت هناك قيمة لهذه
المعلمات، يتم استخدامها لتهيئة حقل بيانات التعريف. إذا لم تكن هناك قيمة
باسم معلمة البيانات الوصفية، يتم تهيئة بيانات التعريف باستخدام معلمة
لاحقة واحدة (.defaultValue
).
يعرض الجدول التالي مَعلمات ضبط البيانات الوصفية.
الإعداد | المعلَمة |
العنوان | itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=
عنوان العنصر إذا لم يتم ضبط title.field على قيمة، يتم ضبط قيمة
يتم استخدام title.defaultValue .
|
عنوان URL لمستودع المصدر | itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
عنوان URL الخاص بالسلعة المستخدَم في نتائج البحث يمكنك للتو ضبط defaultValue على تعليق
عنوان URL للمستودع بأكمله، مثل ما إذا كان التكرار عبارة عن ملف CSV ويوجد واحد فقط
عنوان URL لكل سلعة إذا لم يتم ضبط sourceRepositoryUrl.field
إلى قيمة، يتم استخدام قيمة sourceRepositoryUrl.defaultValue .
|
اسم الحاوية | itemMetadata.containerName.field=containerName
itemMetadata.containerName.defaultValue=myDefaultContainerName
اسم حاوية العنصر، مثل اسم دليل أو مجلد نظام الملفات. في حال حذف لم يتم ضبط containerName.field على قيمة، فإن قيمة
يتم استخدام containerName.defaultValue .
|
نوع الكائن | itemMetadata.objectType.field=type itemMetadata.objectType.defaultValue=
نوع الكائن الذي تستخدمه الموصل، كما هو محدد في السمة المخطط. لن يفهرس الموصِّل أي بيانات منظَّمة إذا لم يتم تحديد هذه السمة. إذا لم يتم تعيين objectType.field على قيمة، فإن قيمة
يتم استخدام objectType.defaultValue .
|
وقت الإنشاء | itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17
الطابع الزمني لإنشاء المستند إذا لم يتم ضبط createTime.field على قيمة، سيتم
استخدام قيمة createTime.defaultValue .
|
وقت التعديل | itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17
الطابع الزمني لآخر تعديل للعنصر إذا لم يتم ضبط updateTime.field على
قيمة، يتم استخدام قيمة updateTime.defaultValue .
|
لغة المحتوى | itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=
لغة المحتوى للمستندات التي تتم فهرستها: إذا كانت السمة contentLanguage.field
لم يتم تعيينه على قيمة، فسيتم استخدام قيمة contentLanguage.defaultValue .
|
نوع MIME | itemMetadata.mimeType.field=mimeType
itemMetadata.mimeType.defaultValue=
نوع MIME الأصلي لـ ItemContent.content في مستودع المصدر. الحد الأقصى للطول هو 256 حرفًا. إذا لم يتم ضبط mimeType.field على قيمة، يتم ضبط قيمة
يتم استخدام mimeType.defaultValue .
|
البيانات الوصفية لجودة البحث | itemMetadata.searchQualityMetadata.quality.field=quality
itemMetadata.searchQualityMetadata.quality.defaultValue=
إشارة إلى جودة السلعة، تُستخدَم للتأثير في جودة البحث يجب أن تكون القيمة بين 0.0 (أدنى جودة) و1.0 (أعلى جودة) القيمة التلقائية هي 0.0. إذا كانت لم يتم ضبط quality.field على قيمة، يمكن
يتم استخدام quality.defaultValue .
|
تجزئة | itemMetadata.hash.field=hash
itemMetadata.hash.defaultValue=f0fda58630310a6dd91a7d8f0a4ceda2
قيمة التجزئة التي يوفّرها المتصل بواجهة برمجة التطبيقات. ويمكن استخدام ذلك مع items.push لحساب الحالة المعدَّلة. الحدّ الأقصى للطول هو 2048.
الأحرف. إذا لم يتم ضبط hash.field على قيمة، يتم ضبط قيمة
يتم استخدام hash.defaultValue .
|
تنسيقات التاريخ والوقت
تحدد تنسيقات التاريخ والوقت التنسيقات المتوقعة في سمات البيانات الوصفية. إذا كان ملف التهيئة لا يحتوي على هذه المعلمة، فسيتم استخدام القيم الافتراضية. يعرض الجدول التالي هذه المَعلمة.
الإعداد | المعلَمة |
تنسيقات إضافية للتاريخ والوقت | structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
قائمة مفصولة بفواصل منقوطة تضم java.time.format.DateTimeFormatter إضافية
أنماط. يتم استخدام الأنماط عند تحليل قيم السلسلة لأي حقل تاريخ أو وقت
في بيانات التعريف أو المخطط. تكون القيمة التلقائية هي قائمة فارغة، ولكن يجب استخدام RFC 3339 وRFC 1123.
يتم دعم التنسيقات دائمًا.
|
البيانات المنظَّمة
توفّر واجهة Cloud Search Indexing API خدمة المخطط التي يمكنك استخدامها من أجل تخصيص كيفية فهرسة Cloud Search لبياناتك وعرضها فيها إذا كنت تستخدم مخطّط المستودع المحلي، يجب تحديد مخطّط البيانات المنظَّمة على الجهاز اسم المخطط.
الإعدادات | المعلمة |
---|---|
اسم المخطط المحلي | structuredData.localSchema=mySchemaName
تتم قراءة اسم المخطط من مصدر البيانات ويُستخدم للمستودع البيانات المهيكلة. القيمة التلقائية هي سلسلة فارغة. |
جودة البحث والمحتوى
بالنسبة إلى المستودعات التي تشتمل على محتوى سجلّ أو محتوى يستند إلى حقل (مثل نظام إدارة علاقات العملاء أو CVS أو قاعدة بيانات)، تسمح حزمة تطوير البرامج (SDK) بتنسيق HTML التلقائي لحقول البيانات. موصل يحدد حقول البيانات في بداية تنفيذ الموصل، ثم تستخدم قالب محتوى لتنسيق كل سجل بيانات قبل تحميله إلى Cloud Search.
يحدد نموذج المحتوى أهمية كل قيمة حقل للبحث.
رمز HTML <title>
مطلوبًا وتحديده على أنه الأولوية القصوى. يمكنك
تحديد مستويات أهمية جودة البحث في جميع حقول المحتوى الأخرى:
مرتفع أو متوسط أو منخفض. أي حقل محتوى غير معرّف في فئة معينة
القيمة الافتراضية على أولوية منخفضة.
الإعدادات | المعلمة |
---|---|
عنوان HTML للمحتوى | contentTemplate.templateName.title=myTitleField
حقل عنوان HTML للمحتوى وحقل أعلى جودة للبحث. هذه المعلمة مطلوبة وذلك فقط إذا كنت تستخدم نموذج محتوى HTML. القيمة التلقائية هي حقل السلسلة. |
جودة بحث عالية لحقول المحتوى | contentTemplate.templateName.quality.high=hField1,hField2
يتم منح حقول المحتوى أولوية بحث عالية. القيمة التلقائية هي سلسلة فارغة. |
جودة بحث متوسطة عن حقول المحتوى | contentTemplate.templateName.quality.medium=mField1,mField2
يتم منح حقول المحتوى أولوية بحث متوسطة. القيمة التلقائية هي سلسلة فارغة. |
جودة بحث منخفضة عن حقول المحتوى | contentTemplate.templateName.quality.low=lField1,lField2
تحظى حقول المحتوى بأولوية بحث منخفضة. القيمة التلقائية هي سلسلة فارغة. |
حقول محتوى غير محدّدة | contentTemplate.templateName.unmappedColumnsMode=value
كيفية تعامل الموصِّل مع حقول المحتوى غير المحددة. القيم الصالحة هي:
|
تضمين أسماء الحقول في نموذج HTML | contentTemplate.templateName.includeFieldName=true|false
لتحديد ما إذا كان سيتم تضمين أسماء الحقول مع بيانات الحقول في ملف HTML
القالب. القيمة التلقائية هي |
المَعلمات غير المألوفة
نادرًا ما تحتاج إلى ضبط المعلمات المدرجة في هذا القسم. الإعدادات الافتراضية للمعلمات هي من أجل تحقيق الأداء الأمثل. لا توصي Google بتعيين هذه المعلمات على مختلفة عن قيمها الافتراضية دون متطلبات محددة داخل المستودع.
إعداد الخادم الوكيل
تسمح لك حزمة تطوير البرامج (SDK) بإعداد الموصِّل لاستخدام خادم وكيل للاتصالات الصادرة.
المعلمتان transport.proxy.hostname
وtransport.proxy.port
هما
المطلوبة لتفعيل النقل من خلال خادم وكيل. قد تكون المَعلمات الأخرى مطلوبة
إذا كان الخادم الوكيل يتطلب المصادقة أو يعمل باستخدام بروتوكول SOCKS بدلاً من HTTP. في حال حذف
لم يتم ضبط transport.proxy.hostname
، لذا لن تستخدم حزمة تطوير البرامج (SDK) خادمًا وكيلاً.
الإعدادات | المعلمة |
---|---|
اسم المضيف | transport.proxy.hostname=hostname
اسم المضيف للخادم الوكيل. هذه المعلمة مطلوبة عند استخدام خادم وكيل. |
المنفذ | transport.proxy.port=port
رقم المنفذ للخادم الوكيل. هذه المعلمة مطلوبة عند استخدام خادم وكيل. |
نوع الخادم الوكيل | transport.proxy.type=type
نوع الخادم الوكيل. القيم الصالحة هي:
تكون القيمة التلقائية |
اسم المستخدم | transport.proxy.username=username
اسم المستخدم الذي سيتم استخدامه عند إنشاء رمز مميز لتفويض الخادم الوكيل. هذه المعلمة اختيارية، ويجب ضبطها فقط إذا كان الخادم الوكيل يتطلب المصادقة. |
كلمة المرور | transport.proxy.password=password
كلمة المرور التي سيتم استخدامها عند إنشاء رمز مميز لتفويض الخادم الوكيل. هذه المعلمة اختيارية، ويجب ضبطها فقط إذا كان الخادم الوكيل يتطلب المصادقة. |
أدوات الاجتياز
تُمكّنك حزمة تطوير البرامج (SDK) من تحديد برامج اجتياز فردية متعددة للسماح اجتيازات متوازية لمستودع البيانات. تستخدم موصِّلات نماذج حزمة تطوير البرامج (SDK) هذا الجديدة.
الإعدادات | المعلمة |
---|---|
حجم مجموعة سلاسل المحادثات | traverse.threadPoolSize=size
عدد السلاسل التي ينشئها الموصل للسماح بالمعالجة المتوازية. حاسمة مكرر واحد يجلب العمليات بشكل متسلسل (عادةً كائنات RepositoryDoc)، ولكن تتم معالجة طلبات البيانات من واجهة برمجة التطبيقات بالتوازي باستخدام هذا العدد من سلاسل المحادثات. تكون القيمة التلقائية |
حجم القسم | traverse.partitionSize=batchSize
عدد تكون القيمة التلقائية |
طلبات استطلاع أداة الاجتياز
يمثل جوهر قائمة انتظار الفهرسة في Cloud Search قائمة انتظار أولوية تحتوي لكل عنصر معروف بوجوده. يمكن لأداة ربط البيانات طلب إجراء استطلاع. من واجهة برمجة تطبيقات الفهرسة. يحصل طلب الاستطلاع على الأولوية القصوى للإدخالات من قائمة انتظار الفهرسة.
يستخدِم نموذج موصِّل بيانات المنتج في حزمة تطوير البرامج المَعلمات التالية من أجل تحديد معايير الاستطلاع.
الإعدادات | المعلمة |
---|---|
برنامج اجتياز المستودع | repository.traversers=t1, t2, t3, ...
تنشئ أداة اجتياز فردية واحدة أو أكثر حيث تكون t1 وt2 وt3 و
... هو الاسم الفريد لكل منهما. لكل اجتياز مُسمّى مجموعة خاصة من الإعدادات
والتي يتم تحديدها باستخدام الاسم الفريد للاجتياز، مثل
" |
قائمة الانتظار المطلوب استطلاعها | traverser.pollRequest.queue=mySpecialQueue
يمكنك وضع الأسماء في قائمة الانتظار التي يستطلعها هذا الفاصل. الإعداد الافتراضي هو سلسلة فارغة (يعني ذلك "تلقائي"). |
traverser.t1.pollRequest.queue=mySpecialQueue
عندما يكون لديك العديد من الاجتيازات، يمكنك ضبط حالات العنصر لكل اجتياز. (حيث تمثل t1 أداة اجتياز محددة). |
|
سلوك الاستطلاع | traverser.pollRequest.limit=maxItems
الحد الأقصى لعدد العناصر المطلوب عرضها من طلب الاستطلاع.
القيمة التلقائية هي |
traverser.t1.pollRequest.limit=limit
عندما يكون لديك العديد من الاجتيازات، يمكنك ضبط حالات العنصر لكل اجتياز. (حيث تمثل t1 أداة اجتياز محددة). |
|
حالة العنصر | traverser.pollRequest.statuses=statuses
يشير هذا المصطلح إلى حالات العنصر المحدّد التي يعرضها الاجتياز هذا، حيث يمكن إدخال statuses.
أي مجموعة من |
traverser.t1.pollRequest.statuses=statusesForThisTraverser
عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا). | |
تحميل المضيف | traverser.hostload=threads
الحد الأقصى لعدد سلاسل المحادثات المتوازية النشطة المتاحة للاستطلاع. الإعداد التلقائي
القيمة هي |
traverser.t1.hostload=threadsForThisTraverser
عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا). |
|
عملية استبعاد للقناة لمهلة معيّنة | traverser.timeout=timeout
قيمة المهلة لمقاطعة محاولة استطلاع الاجتياز هذه. تكون القيمة التلقائية |
traverser.t1.timeout=timeoutForThisTraverser
عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا). |
|
traverser.timeunit=timeoutUunit
وحدات المهلة. القيم الصالحة هي |
|
traverser.t1.timeunit=timeoutUnit
عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا). |
في معظم الحالات، يستخدم الموصِّل الذي يستخدم نموذج موصِّل بطاقة بيانات حزمة SDK فقط تتطلب مجموعة واحدة من المَعلَمات لإجراء الاستطلاع. في بعض الحالات، قد تحتاج إلى تحدد أكثر من معيار استطلاع واحد إذا كانت خوارزمية الاجتياز تتطلب فصل معالجة العنصر باستخدام قوائم انتظار مختلفة، على سبيل المثال.
في هذه الحالة، يمكنك تحديد مجموعات متعددة من الاستطلاعات.
المعلَمات. ابدأ بتحديد أسماء مجموعات المَعلمات باستخدام
repository.traversers
لكل اسم فاصل محدّد،
ملف تهيئة مع المعلمات في الجدول أعلاه استبدال
t1
باسم الاجتياز. يؤدي هذا إلى إنشاء مجموعة من الاستطلاعات
لكل فاصل محدَّد.
نقاط التفتيش
النقطة المرجعية مفيدة لتتبع حالة الاجتياز التدريجي.
الإعدادات | المعلمة |
---|---|
دليل نقاط التفتيش | connector.checkpointDirectory=/path/to/checkpoint
تحدّد المسار إلى الدليل المحلي لاستخدامه في نقاط فحص الاجتياز التزايدي والكامل. |
تحميل المحتوى
يتم تحميل محتوى العنصر إلى Cloud Search باستخدام العنصر عند لم يتخطى حجم المحتوى الحد الأقصى المحدد. إذا كان حجم المحتوى يتجاوز الحد المسموح به، يتم تحميل المحتوى بشكل منفصل عن ملفات بيانات التعريف والبيانات المهيكلة.
الإعدادات | المعلمة |
---|---|
الحد الأدنى للمحتوى | api.contentUploadThresholdBytes=bytes
الحد الأدنى للمحتوى الذي يحدّد ما إذا كان سيتم تحميله "مضمّنًا" مع العنصر مقابل استخدام تحميل منفصل. القيمة التلقائية هي |
الحاويات
يستخدم نموذج الموصل الكامل خوارزمية تتضمن مفهوم تبديل قائمة انتظار مصدر البيانات المؤقتة لاكتشاف السجلات المحذوفة في قاعدة البيانات. وهذا يعني أنه في كل عملية اجتياز كاملة، تظهر السجلات التي تم استرجاعها، وهي موجودة في قائمة انتظار جديدة، يمكنك استبدال جميع سجلات Cloud Search الحالية التي تمت فهرستها من الاجتياز السابق، وهو موجود في قائمة انتظار قديمة.
الإعدادات | المعلمة |
---|---|
علامة اسم الحاوية | traverse.queueTag=instance
لتشغيل مثيلات متعددة من الموصل بالتوازي لفهرسة بيانات شائعة (سواء في مستودعات بيانات مختلفة أو في أجزاء منفصلة من مستودع البيانات) دون أن تتداخل مع بعضها البعض، يمكنك تعيين حاوية فريدة علامة الاسم إلى كل عملية تشغيل للموصل. تمنع علامة الاسم الفريدة توصيل الموصِّل مثال من حذف سجلات شخص آخر. يتم إلحاق علامة الاسم بمعرّف قائمة انتظار تبديل موصل الاجتياز الكامل. |
إيقاف رصد الحذف | traverse.useQueues=true|false
يشير إلى ما إذا كان الموصل يستخدم منطق تبديل قائمة الانتظار لاكتشاف الحذف. إنّ القيمة التلقائية هي ملاحظة: تنطبق مَعلمة الضبط هذه على الموصِّلات فقط.
جارٍ تنفيذ نموذج |
سياسة الدفعات
تتوافق حزمة تطوير البرامج (SDK) مع سياسة مجمَّعة تتيح لك تنفيذ ما يلي: الإجراءات:
- الطلبات المجمّعة
- تحديد عدد الطلبات في قائمة انتظار مجمّعة
- إدارة الدفعات التي يتم تنفيذها بشكل متزامن
- مسح الطلبات المجمّعة
تعمل حزمة تطوير البرامج (SDK) على تجميع طلبات الموصِّل معًا لتسريع سرعة معالجة البيانات أثناء. عمليات التحميل. يتم تشغيل SDK لتحميل مجموعة من الطلبات عن طريق إما عدد الطلبات أو المهلة، أيهما أقرب. على سبيل المثال، إذا كانت قيمة انتهاء مدة تأخير الدفعة بدون الوصول إلى حجم الدفعة أو إذا عدد العناصر في الدفعة قبل انتهاء وقت التأخير، سيتم تشغيل التحميل المجمَّع.
الإعدادات | المعلمة |
---|---|
الطلبات المجمّعة | batch.batchSize
تجميع الطلبات معًا. تكون القيمة التلقائية |
عدد الطلبات في قائمة انتظار مجمّعة | batch.maxQueueLength=maxQueueLength
الحدّ الأقصى لعدد الطلبات في قائمة انتظار مجمّعة للتنفيذ.
القيمة التلقائية هي |
تنفيذ الدفعات بشكل متزامن | batch.maxActiveBatches=maxActiveBatches
عدد الدفعات التي يتم تنفيذها بشكل متزامن المسموح به.
تكون القيمة التلقائية |
مسح الطلبات المجمّعة تلقائيًا | batch.maxBatchDelaySeconds=maxBatchDelay
عدد الثواني التي يجب الانتظار خلالها قبل تحميل الطلبات المجمّعة
تنقَّلت تلقائيًا. تشير رسالة الأشكال البيانية
والقيمة التلقائية هي |
مسح الطلبات المجمّعة عند إيقاف التشغيل | batch.flushOnShutdown=true|false
يتم مسح الطلبات المجمّعة أثناء إيقاف الخدمة.
القيمة التلقائية هي |
معالِجات الاستثناء
تحدد معلمات معالِجات الاستثناء كيفية تقدم أداة الاجتياز بعد استثناءً.
الإعدادات | المعلمة |
---|---|
تعليمات أداة الاجتياز في حال حدوث خطأ | traverse.exceptionHandler=exceptions
الطريقة التي يجب أن يعمل بها الاجتياز بعد طرح استثناء. القيم الصالحة هي:
|
وقت الانتظار بين الاستثناءات | abortExceptionHander.backoffMilliSeconds=backoff
وقت التراجع بالمللي ثانية للانتظار بين استثناءات المعالِج التي تم رصدها
(تُستخدم عادةً عند اجتياز مستودع). تكون القيمة التلقائية |