تتيح حزمة تطوير البرامج (SDK) للموصل وواجهة برمجة التطبيقات في Cloud Search إنشاء قوائم انتظار الفهرسة في Cloud Search. يمكنك استخدام قوائم الانتظار هذه لإجراء ما يلي:
- الاحتفاظ بحالة كل مستند (الحالة، والتجزئة، وما إلى ذلك) للحفاظ على مزامنة الفهرس
- الاحتفاظ بقائمة بالعناصر التي سيتم فهرسة محتواها، كما تم رصدها أثناء الزحف
- تحديد أولويات العناصر استنادًا إلى حالتها
- الاحتفاظ بمعلومات الحالة، مثل نقاط التحقّق ورموز التغيير
قائمة الانتظار هي تصنيف يتم تعيينه لعنصر مفهرس (مثل "تلقائي").
الحالة والأولوية
تعتمد أولوية المستند على
ItemStatus
الخاص به. الرموز المحتملة، حسب ترتيب الأولوية (من الأعلى إلى الأدنى)، هي:
-
ERROR: حدث خطأ غير متزامن في العنصر ويجب إعادة فهرسته. MODIFIED: تم فهرسة العنصر سابقًا، ولكن تم تغييره في المستودع.-
NEW_ITEM: لم تتم فهرسة السلعة بعد. -
ACCEPTED: تمت فهرسة العنصر سابقًا ولم يتم تغييره.
بالنسبة إلى العناصر التي لها الحالة نفسها، تكون الأولوية للعناصر التي بقيت في قائمة الانتظار لأطول مدة.
فهرسة عنصر جديد أو معدَّل
يعرض الشكل 1 خطوات فهرسة عنصر جديد أو معدَّل باستخدام قائمة انتظار الفهرسة. تعكس هذه الخطوات طلبات REST API، وللحصول على مكافئاتها في حزمة تطوير البرامج (SDK)، يُرجى الاطّلاع على عمليات قائمة الانتظار (حزمة تطوير البرامج للموصل).
- يستخدم موصّل المحتوى
items.pushلنقل البيانات الوصفية والتجزئة إلى قائمة انتظار.- إذا كان الموصل يتضمّن عملية إرسال
typeأوcontentHash، يحدّد Cloud Search الحالة. - تتلقّى العناصر غير المعروفة الحالة
NEW_ITEM. - ستبقى العناصر الحالية التي تتضمّن تجزئات مطابقة
ACCEPTED. - تصبح العناصر الحالية التي تتضمّن رموزًا مختلفة
MODIFIED.
- إذا كان الموصل يتضمّن عملية إرسال
- تستخدم الوصلة
items.pollلتحديد العناصر التي سيتم فهرستها. تعرض Cloud Search العناصر بترتيب الأولوية. - يسترد الموصل العناصر من المستودع وينشئ طلبات بيانات من واجهة برمجة التطبيقات للفهرس.
- يستخدم الموصّل
items.indexلفهرسة العناصر. تنتقل السلعة إلى الحالةACCEPTEDبعد معالجتها بنجاح.
حذف عنصر
تستخدم استراتيجية التنقّل الكامل قائمتَي انتظار لفهرسة العناصر ورصد عمليات الحذف. يوضّح الشكل 2 عملية الانتقال الثانية في هذه الاستراتيجية.
- أثناء عملية المسح الأولية، يدفع الموصل العناصر إلى "صفّ أ" على النحو التالي:
NEW_ITEM. يتلقّى كل عنصر التصنيف "أ". - يستطلع الموصل قائمة الانتظار (أ) ويفهرس العناصر.
- في عملية الاجتياز الكامل الثانية، تدفع أداة الربط العناصر إلى "قائمة الانتظار B".
- تتلقّى العناصر غير المعروفة التصنيف "ب" والحالة
NEW_ITEM. - يتم تغيير تصنيف العناصر الحالية التي تتضمّن تجزئة مطابقة إلى "B" وتبقى
ACCEPTED. - يتم تغيير تصنيف العناصر الحالية التي تتضمّن رموزًا مختلفة إلى "ب" وتصبح
MODIFIED.
- تتلقّى العناصر غير المعروفة التصنيف "ب" والحالة
- يستطلع الموصل قائمة الانتظار B ويفهرس العناصر.
- أخيرًا، يستدعي الموصل
deleteQueueItemsفي قائمة الانتظار A. يؤدي ذلك إلى حذف جميع العناصر المفهرسة سابقًا والتي لا يزال لديها التصنيف "أ". - في عمليات الاجتياز اللاحقة، يتم تبديل أدوار قائمتَي الانتظار.
عمليات قائمة الانتظار (حزمة تطوير البرامج (SDK) الخاصة بأداة الربط)
استخدِم أداة الإنشاء
pushItems
لإضافة عناصر. تسحب حزمة تطوير البرامج (SDK) تلقائيًا العناصر من قائمة الانتظار حسب ترتيب الأولوية باستخدام طريقة getDoc في الفئة Repository.
عمليات قائمة الانتظار (REST API)
- لإرسال إشعار: استخدِم
Items.push. - لإجراء استطلاع، استخدِم
Items.poll.
يمكنك أيضًا استخدام
Items.index
لدفع العناصر أثناء الفهرسة. تتلقّى هذه العناصر الحالة ACCEPTED تلقائيًا.
Items.push
تضيف هذه الطريقة أرقام تعريف إلى قائمة الانتظار. يحدّد
type
النتيجة. يؤدي إرسال معرّف جديد إلى إضافة إدخال بالحالة NEW_ITEM.
يتم عرض الحمولة الاختيارية أثناء الاستطلاع.
يتم حجز العناصر التي تم استطلاعها، ولا يمكن إرجاعها من خلال طلبات استطلاع أخرى. يؤدي استخدام
Items.push مع ضبط type على NOT_MODIFIED أو REPOSITORY_ERROR أو
REQUEUE إلى إلغاء حجز الإدخالات.
Items.push with hashes
تحديد البيانات الوصفية أو رموز التجزئة للمحتوى في طلب الإرسال
يقارن Cloud Search هذه القيم بالقيم المخزّنة. إذا لم تتطابقا، سيصبح الإدخال MODIFIED. تصبح أرقام التعريف غير المتطابقة وغير المتوفّرة NEW_ITEM.
Items.poll
يستردّ هذا الإجراء الإدخالات ذات الأولوية العالية. يتم حجز كل إدخال تم إرجاعه
إلى أن تنتهي مهلته أو تتم إعادة فهرسته أو يتم إلغاء حجزه باستخدام Items.push.