تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

نشر موصل CSV

هذا الدليل مخصّص لمشرفي موصل Google Cloud Search CSV (قيم مفصولة بفواصل)، أي أي شخص مسؤول عن تنزيل الموصّل وضبطه وتشغيله ومراقبته.

يتضمّن هذا الدليل تعليمات لتنفيذ المهام الرئيسية المتعلّقة بنشر محوِّل CSV:

تنزيل برنامج موصل ملف CSV في Google Cloud Search
ضبط الموصّل لاستخدامه مع مصدر بيانات CSV معيّن
نشر الموصّل وتشغيله

لفهم المفاهيم الواردة في هذا المستند، يجب أن تكون على دراية بأساسيات Google Workspace وملفات CSV وقوائم التحكّم في الوصول (ACL).

نظرة عامة على محوِّل ملفات CSV في Google Cloud Search

يعمل موصل CSV في Cloud Search مع أي ملف نصي بتنسيق CSV. يخزِّن ملف CSV البيانات في شكل جداول، ويمثّل كل سطر في الملف سجلّ بيانات.

يستخرج "موصِّل ملفات CSV" في Google Cloud Search صفوفًا فردية من ملف CSV ويصنّفها في Cloud Search من خلال واجهة برمجة التطبيقات Indexing API في Cloud Search. بعد أن تتم فهرسة الملفات بنجاح، يمكن البحث عن الصفوف الفردية من ملفات CSV من خلال عملاء Cloud Search أو Query API في Cloud Search. يتيح محوِّل ملفات CSV أيضًا التحكّم في وصول المستخدمين إلى المحتوى في نتائج البحث، وذلك باستخدام قوائم التحكّم بالوصول.

يمكن تثبيت موصل CSV في Google Cloud Search على نظام التشغيل Linux أو Windows. قبل نشر محوِّل ملفات CSV في Google Cloud Search، تأكَّد من توفُّر المكوّنات المطلوبة التالية:

تثبيت Java JRE 1.8 على جهاز كمبيوتر يعمل بتنسيق CSV موصِّل Google Cloud Search
معلومات Google Workspace المطلوبة لإنشاء علاقات بين Google Cloud Search ومصدر البيانات:
- مفتاح Google Workspace الخاص (الذي يحتوي على رقم تعريف حساب الخدمة)
- رقم تعريف مصدر بيانات Google Workspace
عادةً ما يقدّم مشرف Google Workspace للنطاق هذه بيانات الاعتماد نيابةً عنك.

خطوات النشر

لنشر محوِّل ملفات CSV في Google Cloud Search، اتّبِع الخطوات التالية:

تثبيت برنامج موصل CSV في Google Cloud Search
تحديد إعدادات موصِّل CSV
ضبط أذونات الوصول إلى مصدر بيانات Google Cloud Search
ضبط أذونات الوصول إلى ملف CSV
تحديد أسماء الأعمدة التي سيتم فهرستها وأعمدة المفاتيح الفريدة وأعمدة التاريخ والوقت
تحديد الأعمدة لاستخدامها في عناوين URL لنتائج البحث القابلة للنقر
تحديد معلومات البيانات الوصفية وتنسيقات الأعمدة
جدولة تنقّل البيانات
تحديد خيارات قائمة التحكّم بالوصول (ACL)

1. تثبيت حزمة تطوير البرامج (SDK)

ثبِّت حزمة SDK في مستودع Maven على جهازك.

استنسِخ مستودع حزمة SDK من GitHub.

$ git clone https://github.com/google-cloudsearch/connector-sdk.git
$ cd connector-sdk/csv

اطّلِع على الإصدار المطلوب من حزمة تطوير البرامج (SDK):
```
$ git checkout tags/v1-0.0.3
```
إنشاء الموصّل:
```
$ mvn package
```

انسخ ملف zip الخاص بالموصّل إلى دليل التثبيت على الجهاز:

$ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
$ cd installation-dir
$ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
$ cd google-cloudsearch-csv-connector-v1-0.0.3

2. تحديد إعدادات موصّل ملف CSV

بصفتك مشرف الموصّل، يمكنك التحكّم في سلوك موصّل CSV و سماته التي تحدّد المَعلمات في ملف إعدادات الموصّل. تشمل المَعلمات القابلة للضبط ما يلي:

الوصول إلى مصدر بيانات
موقع ملف CSV
تعريفات أعمدة ملف CSV
الأعمدة التي تحدّد معرّفًا فريدًا
خيارات التنقّل
خيارات قائمة التحكّم بالوصول لحظر الوصول إلى البيانات

لكي يتمكّن الموصّل من الوصول إلى ملف CSV بشكل صحيح وفهرسة المحتوى ذي الصلة، يجب أولاً إنشاء ملف الإعدادات الخاص به.

لإنشاء ملف إعدادات، اتّبِع الخطوات التالية:

افتح محرِّر نصوص من اختيارك وحدِّد اسمًا لملف الإعدادات.
أضِف أزواج المفتاح=القيمة إلى محتوى الملف كما هو موضّح في القسمين التاليين.
احفظ ملف الإعدادات وامنحه اسمًا.
تنصح Google بتسمية ملف الإعدادات connector-config.properties كي لا تكون هناك معلمات سطر أوامر إضافية مطلوبة لتشغيل الموصِّل.

بما أنّه يمكنك تحديد مسار ملف الإعدادات في سطر الأوامر، ليس من الضروري تحديد موقع ملف عادي. ومع ذلك، عليك الاحتفاظ بملف الإعدادات في الدليل نفسه الذي يتضمّن الموصِّل لتبسيط عملية تتبُّع الموصِّل وتشغيله.

لضمان تعرّف الموصِّل على ملف الإعداد، حدِّد مساره في سطر الأوامر. وإلا، سيستخدم الموصّل connector-config.properties في دليلك المحلي كاسم الملف default. للحصول على معلومات عن تحديد مسار الإعداد على سطر الأوامر، يُرجى الاطّلاع على تشغيل أداة ربط ملف CSV في Cloud Search.

3- ضبط أذونات الوصول إلى مصدر بيانات Google Cloud Search

المَعلمات الأولى التي يجب أن يحدّدها كل ملفّ إعدادات هي المَعلمات الضرورية للوصول إلى مصدر بيانات Cloud Search، كما هو موضّح في جدول التالي. ستحتاج عادةً إلى معرّف مصدر البيانات ومعرّف حساب الخدمة و المسار إلى ملف المفتاح الخاص لحساب الخدمة من أجل ضبط إذن وصول أداة الربط إلى Cloud Search. يمكنك الاطّلاع على الخطوات المطلوبة لإعداد مصدر بيانات في مقالة إدارة مصادر بيانات الجهات الخارجية.

الإعدادات	المَعلمة
معرّف مصدر البيانات	`api.sourceId=1234567890abcdef` مطلوب. رقم تعريف مصدر Google Cloud Search الذي أعدّه مشرف Google Workspace، كما هو موضّح في مقالة إدارة مصادر البيانات التابعة لجهات خارجية.
مسار ملف المفتاح الخاص لحساب الخدمة	`api.serviceAccountPrivateKeyFile=./PrivateKey.json` مطلوب. ملف مفتاح حساب خدمة Google Cloud Search للوصول إلى موصل CSV في Google Cloud Search
رقم تعريف مصدر الهوية	`api.identitySourceId=x0987654321` مطلوب في حال استخدام مستخدمين ومجموعات خارجيين. رقم تعريف مصدر الهوية في Google Cloud Search الذي أعدّه مشرف Google Workspace

4. ضبط مَعلمات ملف CSV

قبل أن يتمكّن الموصّل من التنقّل في ملف CSV واستخراج البيانات منه بهدف الفهرسة، عليك تحديد مسار الملف. يمكنك أيضًا تحديد تنسيق الملف ونوع ترميزه. أضِف المَعلمات التالية لتحديد سمات ملف CSV في ملف الإعدادات.

الإعدادات	المَعلمة
مسار ملف CSV	`csv.filePath=./movie_content.csv` مطلوب. مسار ملف CSV الذي يجب الوصول إليه واستخراج المحتوى منه للفهرسة
تنسيق الملف	`csv.format=DEFAULT` تنسيق الملف القيم المحتمَلة هي من فئة CSVFormat في Apache Commons CSV. تشمل قيم التنسيق ما يلي: `DEFAULT` و`EXCEL` و`INFORMIX_UNLOAD` و`INFORMIX_UNLOAD_CSV` و`MYSQL` و`RFC4180` و`ORACLE` و`POSTGRESQL_CSV` و`POSTGRESQL_TEXT` و`TDF`. إذا لم يتم تحديدها، تستخدم Cloud Search `DEFAULT`.
مُعدِّل تنسيق الملف	`csv.format.withMethod=value` تعديل على طريقة تعامل Cloud Search مع الملف تأتي الطرق المحتمَلة من فئة CSVFormat في Apache Commons CSV، وتشمل تلك التي تأخذ حرفًا واحدًا أو سلسلة أو قيمة منطقية. على سبيل المثال، لتحديد فاصلة منقوطة كفاصل، استخدِم `csv.format.withDelimiter=;`. لتجاهل الأسطر الفارغة، استخدِم `csv.format.withIgnoreEmptyLines=true`.
نوع ترميز الملف	`csv.fileEncoding=UTF-8` مجموعة أحرف Java المُستخدَمة عندما تقرأ خدمة Cloud Search الملف في حال عدم تحديدها، تستخدم Cloud Search مجموعة الأحرف التلقائية للنظام الأساسي.

5- تحديد أسماء الأعمدة التي ستتم فهرستها وأعمدة المفاتيح الفريدة

لكي يتمكّن الموصّل من الوصول إلى ملفات CSV والفهرسة، يجب تقديم معلومات عن تعريفات الأعمدة في ملف الإعدادات. إذا كانملف الإعدادات لا يحتوي على المَعلمات التي تحدّد أسماء الأعمدة التي سيتم فهرستها وأعمدة المفاتيح الفريدة، يتم استخدام القيم التلقائية.

الإعدادات	المَعلمة
الأعمدة المطلوب فهرستها	`csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...` أسماء الأعمدة التي سيتم فهرستها من ملف CSV في حال عدم ضبط `csv.csvColumns`، يتم استخدام الصف الأول من ملف CSV كعنوان. إذا تم ضبط `csv.csvColumns`، تكون لها الأولوية على الصف الأول من ملف CSV. إذا ضبطت القيمة `csv.csvColumns` وكان الصف الأول من ملف CSV عبارة عن قائمة بأسماء الأعمدة، عليك ضبط القيمة `csv.skipHeaderRecord=true` لتجنُّب محاولة فهرسة الصف الأول كبيانات. القيم التلقائية هي الأعمدة في صف العنوان في الملف.
أعمدة المفاتيح الفريدة	`csv.uniqueKeyColumns=movieId` أعمدة ملف CSV التي ستُستخدَم قيمها لإنشاء المعرّف الفريد لكل سجلّ. في حال عدم تحديد مفتاح، يجب استخدام التجزئة لسجلّ CSV كمفتاح فريد له. القيمة التلقائية هي رمز التجزئة للسجلّ.

6- تحديد الأعمدة لاستخدامها في عناوين URL لنتائج البحث القابلة للنقر

عندما يبحث أحد المستخدِمين باستخدام Google Cloud Search، يستجيب محرّك البحث من خلال عرض صفحة نتائج تتضمّن عناوين URL قابلة للنقر لكل نتيجة. لتفعيل هذه الميزة، يجب إضافة المَعلمة الموضّحة في الجدول التالي إلى ملف الإعدادات.

الإعدادات	المَعلمة
تنسيق عنوان URL لنتيجة البحث	`url.format=https://mymoviesite.com/movies/{0}` مطلوب. تنسيق إنشاء عنوان URL للعرض لمحتوى ملف CSV
مَعلمات عناوين URL لنتائج البحث	`url.columns=movieId` مطلوب. أسماء أعمدة ملف CSV التي ستُستخدَم قيمها لإنشاء عنوان URL لعرض السجلّ.
معلَمات عناوين URL لنتائج البحث المطلوب تحويلها	`url.columnsToEscape=movieId` اختيارية: أسماء أعمدة ملف CSV التي ستتم إزالة أحرفها الخاصة لإنشاء عنوان URL صالح للعرض

7- تحديد معلومات البيانات الوصفية وتنسيقات الأعمدة وجودة البحث

يمكنك إضافة مَعلمات إلى ملف الإعدادات لتحديد ما يلي:

مَعلمات ضبط البيانات الوصفية
تنسيقات الأعمدة
جودة البحث

مَعلمات إعداد البيانات الوصفية

تصف مَعلمات ضبط البيانات الوصفية أعمدة ملف CSV المستخدَمة لملء datametaitem. إذا لم يحتوي ملف الإعدادات على هذه المَعلمات، يتم استخدام القيم التلقائية. يعرض الجدول التالي هذه المَعلمات.

الإعداد	المعلَمة
العنوان	`itemMetadata.title.field=movieTitle` `itemMetadata.title.defaultValue=Gone with the Wind` سمة البيانات الوصفية التي تحتوي على القيمة المقابلة لعنوان المستند القيمة التلقائية هي سلسلة فارغة.
عنوان URL	`itemMetadata.sourceRepositoryUrl.field=url` `itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/` سمة البيانات الوصفية التي تحتوي على قيمة عنوان URL للمستند في نتائج البحث.
الطابع الزمني للإنشاء	`itemMetadata.createTime.field=releaseDate` `itemMetadata.createTime.defaultValue=1940-01-17` سمة البيانات الوصفية التي تحتوي على قيمة الطابع الزمني لإنشاء المستند
وقت آخر تعديل	`itemMetadata.updateTime.field=releaseDate` `itemMetadata.updateTime.defaultValue=1940-01-17` سمة البيانات الوصفية التي تحتوي على قيمة الطابع الزمني لآخر تعديل للمستند.
لغة المستند	`itemMetadata.contentLanguage.field=languageCode` `itemMetadata.contentLanguage.defaultValue=en-US` لغة محتوى المستندات التي تتم فهرستها
نوع عنصر المخطّط	`itemMetadata.objectType.field=type` `itemMetadata.objectType.defaultValue=movie` نوع العنصر المستخدَم في الوصلة، كما هو محدّد في المخطّط لن يُفهرس الموصّل أي بيانات منظَّمة في حال عدم تحديد هذا الموقع.

تنسيقات التاريخ والوقت

تحدّد تنسيقات التاريخ والوقت التنسيقات المتوقّعة في سمات البيانات الوصفية. إذا لم يحتوي ملف الإعدادات على هذه المَعلمة، يتم استخدام القيم التلقائية. يعرض الجدول التالي هذه المَعلمة.

الإعداد المعلَمة

تنسيقات إضافية للتاريخ والوقت structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
قائمة مفصولة بفاصلة منقوطة بأنماط java.time.format.DateTimeFormatter الإضافية تُستخدَم الأنماط عند تحليل قيم السلاسل لأيّ حقول تاريخ أو وقت في البيانات الوصفية أو المخطّط. القيمة التلقائية هي قائمة فارغة، ولكن يتم دائمًا استخدام تنسيقَي RFC 3339 وRFC 1123.

تنسيقات الأعمدة

تحدّد تنسيقات الأعمدة معلومات عن الأعمدة التي يجب أن تكون جزءًا من المحتوى القابل للبحث. إذا لم يحتوي ملف الإعدادات على هذين المَعلمتَين، يتم استخدام القيم التلقائية. يعرض الجدول التالي هذه المَعلمات.

الإعدادات	المَعلمة
تخطّي العنوان	`csv.skipHeaderRecord=true` منطقي. تجاهل سجلّ العنوان (السطر الأول) في ملف CSV. إذا ضبطت القيمة `csv.csvColumns` وكان ملف CSV يتضمّن صفًا للرؤوس، عليك ضبط القيمة `skipHeaderRecord=true`. ويؤدي ذلك إلى منع فهرسة الصف الأول في الملف كبيانات. إذا لم يتضمّن ملف CSV صفًا للعناوين، اضبط القيمة `skipHeaderRecord=false`. القيمة التلقائية هي false.
الأعمدة التي تحتوي على قيم متعددة	`csv.multiValueColumns=genre,actors` أسماء الأعمدة في ملف CSV التي تحتوي على قيم متعدّدة القيمة التلقائية هي سلسلة فارغة.
محدِّد الأعمدة التي تحتوي على قيم متعددة	`csv.multiValue.genre=;` فاصل الأعمدة التي تحتوي على قيم متعددة المُحدِّد التلقائي هو فاصلة.

جودة البحث

يتيح محوِّل ملف CSV في Cloud Search تنسيق HTML تلقائيًا لحقول البيانات. يحدِّد الموصِّل حقول البيانات في بداية تنفيذ الموصِّل، ويستخدم بعد ذلك نموذج محتوى لتنسيق كل سجلّ بيانات قبل تحميله إلى Cloud Search.

يحدِّد نموذج المحتوى أهمية كل قيمة حقل للبحث. حقل العنوان مطلوب ويتم تحديده على أنّه حقل ذو أولوية قصوى. يمكنك تحديد مستويات أهمية جودة البحث لجميع حقول المحتوى الأخرى: "مرتفع" أو "متوسط" أو "منخفض". أيّ حقل محتوى لم يتمّ تحديده في فئة معيّنة يكون تلقائيًا منخفض الأولوية. يعرض الجدول التالي هذه المَعلمات.

الإعدادات	المَعلمة
عنوان المحتوى	contentTemplate.csv.title=`movieTitle` عنوان المحتوى هو حقل جودة البحث الأعلى.
جودة بحث عالية لحقول المحتوى	contentTemplate.csv.quality.high=`actors` حقول المحتوى التي تم منحها قيمة عالية لجودة البحث الإعداد التلقائي هو سلسلة فارغة.
جودة البحث منخفضة في حقول المحتوى	contentTemplate.csv.quality.low=`genre` حقول المحتوى التي تم منحها قيمة منخفضة لجودة البحث الإعداد التلقائي هو سلسلة فارغة.
جودة بحث متوسطة لحقول المحتوى	contentTemplate.csv.quality.medium=`description` حقول المحتوى التي تم منحها قيمة جودة بحث متوسطة الإعداد التلقائي هو سلسلة فارغة.
حقول المحتوى غير المحدّدة	contentTemplate.csv.unmappedColumnsMode=`IGNORE` كيفية تعامل الموصّل مع حقول المحتوى غير المحدّدة القيم الصالحة هي: ‫APPEND: إلحاق حقول محتوى غير محدّدة بالنّموذج ‫IGNORE: تجاهل حقول المحتوى غير المحدّدة القيمة التلقائية هي APPEND.

8. جدولة تنقّل البيانات

التنقّل هو عملية الموصّل لاكتشاف المحتوى من مصدر البيانات، وفي هذه الحالة، ملف CSV. أثناء تشغيل محوِّل ملفات CSV، سيجتاز صفوف ملف CSV، ويفهرس كل صف في "بحث Google" من خلال واجهة برمجة التطبيقات للفهرسة.

فهرسة التنقّل الكامل لجميع الأعمدة في الملف لا فهرس التنقّل التزايدي سوى الأعمدة التي تمت إضافتها أو تعديلها منذ التنقّل السابق. لا تُجري أداة ربط ملفات CSV سوى عمليات تنقّل كاملة. ولا تُجري عمليات تنقّل تدريجية.

تحدِّد مَعلمات الجدولة عدد المرات التي ينتظرها الموصِّل بين عمليات التنقّل. إذا لم يحتوي ملف الإعدادات على مَعلمات جدولة، يتم استخدام القيمة التلقائية. يعرض الجدول التالي هذه المَعلمات.

الإعدادات	المَعلمة
التنقّل الكامل بعد فترة زمنية	schedule.traversalIntervalSecs=`7200` يُجري الموصِّل عملية تنقّل كاملة بعد فترة زمنية محدّدة. حدِّد الفاصل الزمني بين عمليات التنقّل بالثواني. القيمة التلقائية هي 86400 (عدد الثواني في يوم واحد).
التنقّل الكامل عند بدء تشغيل الموصِّل	schedule.performTraversalOnStart=`false` يُجري الموصِّل عملية تنقّل كاملة عند بدء تشغيله، بدلاً من الانتظار حتى تنتهي الفترة الزمنية الأولى. القيمة التلقائية هي true.

9. تحديد خيارات قائمة التحكّم بالوصول (ACL)

يتيح محوِّل ملفات CSV في Google Cloud Search الأذونات من خلال قوائم التحكّم بالوصول للتحكّم في الوصول إلى محتوى ملف CSV في نتائج البحث. تتوفّر عدة خيارات لجدول التحكم في الوصول (ACL) بهدف السماح لك بحماية وصول المستخدمين إلى السجلّات المفهرَسة.

إذا كان المستودع يحتوي على معلومات فردية لقائمة التحكّم بالوصول (ACL) مرتبطة بكل مستند، حمِّل جميع معلومات قائمة التحكّم بالوصول للتحكّم في الوصول إلى المستندات ضمن Cloud Search. إذا كان مستودعك يقدّم معلومات ACL جزئية أو لا يقدّم أي معلومات، يمكنك تقديم معلومات ACL التلقائية في المَعلمات التالية التي تقدّمها حزمة SDK لملف الاتصال.

يعتمد الموصّل على تفعيل جداول التحكم في الوصول التلقائية في ملف الضبط. ل تفعيل جداول التحكم في الوصول التلقائية، اضبط defaultAcl.mode على أي وضع آخر غير none واضبطه باستخدام defaultAcl.*.

الإعدادات	المَعلمة
وضع ACL	defaultAcl.mode=fallback مطلوب. يعتمد محوِّل ملفات CSV على وظيفة "قائمة التحكّم في الوصول التلقائية". لا يتيح الموصّل سوى وضع النسخ الاحتياطي.
اسم قائمة التحكّم في الوصول التلقائية	defaultAcl.name=`VIRTUAL_CONTAINER_FOR_CONNECTOR_1` اختيارية: يسمح هذا الخيار بتجاوز اسم الحاوية الافتراضية المستخدَم من قِبل الموصِّل لإعداد جداول التحكم في الوصول التلقائية. القيمة التلقائية هي "DEFAULT_ACL_VIRTUAL_CONTAINER". قد تحتاج إلى إلغاء هذه القيمة إذا كانت أدوات ربط متعدّدة تُفهرس المحتوى في مصدر البيانات نفسه.
قائمة التحكم في الوصول العام التلقائية	defaultAcl.public=`true` يتم ضبط قائمة التحكّم في الوصول التلقائية المستخدَمة للمستودع بأكمله على الوصول إلى النطاق العام. القيمة التلقائية هي false.
مستخدمو مجموعة التحكّم في الوصول (ACL) المشتركون	defaultAcl.readers.groups=google:`group1, group2`
برامج قراءة قوائم التحكّم في الوصول الشائعة	defaultAcl.readers.users=`user1, user2, google:user3`
قائمة أذونات الوصول المشتركة تمنع قرّاء المجموعة	defaultAcl.denied.groups=`group3`
قراء ACL المحظورون بشكل شائع	defaultAcl.denied.users=`user4, user5`
الوصول إلى النطاق بأكمله	لتحديد أنّ كل سجلّ مفهرَس يمكن لجميع المستخدمين في النطاق الوصول إليه بشكل علني، اضبط كلا الخيارَين التاليَين بالقيم التالية: defaultAcl.mode=fallback defaultAcl.public=true
قائمة التحكم في الوصول المحدَّدة بشكل شائع	لتحديد قائمة أذونات وصول واحدة لكل سجلّ في مستودع البيانات، اضبط جميع قيم المَعلمات التالية: defaultAcl.mode=fallback defaultAcl.public=false defaultAcl.readers.groups=google:`group1, group2` defaultAcl.readers.users=`user1, user2, google:user3` defaultAcl.denied.groups=`group3` defaultAcl.denied.users=`user4, user5` يُفترض أنّ كل مستخدم ومجموعة محدّدين هما مستخدم/مجموعة محدّدان على مستوى النطاق المحلي ما لم يتم البدء بـ "google:‎" (ثابت حرفي). المستخدم أو المجموعة التلقائية هي سلسلة فارغة. لا تقدِّم خيارات المستخدم والمجموعة إلا إذا تم ضبط defaultAcl.public على false. لإدراج مجموعات ومستخدمين متعدّدين، استخدِم قائمة مفصولة بفواصل. في حال ضبط defaultAcl.mode على none، لا يمكن البحث في السجلات بدون جداول ACL فردية محدّدة.

تعريف المخطط

تسمح خدمة Cloud Search بفهرسة المحتوى المنظَّم وغير المنظَّم وعرض بياناته. لتفعيل طلبات البحث عن البيانات المنظَّمة في بياناتك، عليك إعداد مخطّط لمصدر بياناتك.

بعد تحديد مخطّط، يمكن لموصّل CSV الرجوع إليه لإنشاء طلبات الفهرسة. لنوضّح ذلك، لنفترض أنّ لدينا ملف CSV يحتوي على معلومات عن الأفلام.

لنفترض أنّ ملف CSV الذي يتم إدخاله يحتوي على المحتوى التالي.

movieId
movieTitle
الوصف
سنة
releaseDate
الممثلون (قيم متعدّدة مفصولة بفواصل (،))
النوع (قيم متعدّدة)
التقييمات

استنادًا إلى بنية البيانات أعلاه، يمكنك تحديد مخطّط لمصدر بيانات تريد فهرسة البيانات منه في ملف CSV.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

مثال على ملف الضبط

يعرض مثال ملف الضبط التالي مَعلمات key=value pairs التي تحدّد سلوك مثال على الموصّل.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

للحصول على أوصاف مفصّلة لكل مَعلمة، اطّلِع على مرجع مَعلمات الضبط.

تشغيل موصِّل ملف CSV في Cloud Search

لتشغيل أداة الربط من سطر الأوامر، اكتب الأمر التالي:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

تتوفّر سجلّات الموصّل تلقائيًا في الإخراج العادي. يمكنك تسجيل الدخول إلى الملفات من خلال تحديد logging.properties.