खोज की क्वालिटी का मतलब है कि खोज के नतीजे, रैंकिंग और रिकॉल के मामले में कितने अच्छे हैं. इसका आकलन उपयोगकर्ता करता है.
रैंकिंग का मतलब है कि आइटम किस क्रम में दिखते हैं. वहीं, रिकॉल का मतलब है कि खोज के हिसाब से कितने आइटम मिले. आइटम (या दस्तावेज़) ऐसा डिजिटल कॉन्टेंट होता है जिसे Google Cloud Search इंडेक्स कर सकता है. जैसे, Microsoft Office के दस्तावेज़, PDF फ़ाइलें, डेटाबेस की पंक्तियां या खास यूआरएल. किसी आइटम में ये चीज़ें शामिल होती हैं:
- स्ट्रक्चर्ड मेटाडेटा
- इंडेक्स किया जा सकने वाला कॉन्टेंट
- ACL
Cloud Search, नतीजे पाने और उन्हें रैंक करने के लिए अलग-अलग सिग्नल का इस्तेमाल करता है. स्कीमा, आइटम के कॉन्टेंट और मेटाडेटा में मौजूद सेटिंग के साथ-साथ, सर्च ऐप्लिकेशन की सेटिंग में बदलाव करके, इन सिग्नल पर असर डाला जा सकता है. इस दस्तावेज़ में, सिग्नल पर असर डालने वाली इन सेटिंग में बदलाव करके, खोज की क्वालिटी को बेहतर बनाने का तरीका बताया गया है.
सेटिंग की खास जानकारी के लिए, खोज की क्वालिटी से जुड़ी सेटिंग की खास जानकारी देखें.
विषय के हिसाब से स्कोर पर असर डालना
विषय के हिसाब से स्कोर का मतलब है कि खोज का नतीजा, क्वेरी के शब्दों से कितना मिलता-जुलता है. Cloud Search, विषय के हिसाब से स्कोर की गणना इन आधार पर करता है:
- क्वेरी के हर शब्द की अहमियत.
- हिट की संख्या (क्वेरी का कोई शब्द, कॉन्टेंट या मेटाडेटा में कितनी बार दिखता है).
- क्वेरी के शब्दों और इंडेक्स किए गए आइटम के बीच मैच के टाइप.
टेक्स्ट प्रॉपर्टी के विषय के हिसाब से स्कोर पर असर डालने के लिए, अपने स्कीमा में
RetrievalImportance
तय करें. RetrievalImportance की वैल्यू ज़्यादा होने पर, प्रॉपर्टी से मैच होने पर ज़्यादा स्कोर मिलता है.
उदाहरण के लिए, अगर आपने सॉफ़्टवेयर में मौजूद गड़बड़ियों का इतिहास सेव किया है, तो उपयोगकर्ता गड़बड़ी के नाम से क्वेरी कर सकते हैं.
नाम के लिए, RetrievalImportance को HIGHEST पर सेट करें. मुख्य जानकारी के लिए, DEFAULT का इस्तेमाल करें.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
एचटीएमएल दस्तावेज़ों के लिए, <title> और <h1> जैसे टैग, शब्द की अहमियत तय करने में मदद करते हैं. अगर ContentFormat
की वैल्यू TEXT है, तो ItemContent
के लिए DEFAULT अहमियत का इस्तेमाल किया जाता है. अगर इसकी वैल्यू HTML है, तो अहमियत एचटीएमएल प्रॉपर्टी पर निर्भर करती है.
अपडेट होने की फ़्रीक्वेंसी पर असर डालना
अपडेट होने की फ़्रीक्वेंसी से यह पता चलता है कि किसी आइटम में हाल ही में कब बदलाव किया गया था. इसके लिए, createTime और
updateTime में
ItemMetadata का इस्तेमाल किया जाता है.
पुराने आइटम की रैंक कम होती है.
में freshnessProperty और
freshnessDuration को अडजस्ट करके, अपडेट होने की फ़्रीक्वेंसी पर असर डाला जा सकता है.FreshnessOptions
freshnessProperty की मदद से, updateTime के बजाय, कस्टम तारीख या टाइमस्टैंप का इस्तेमाल किया जा सकता है. गड़बड़ियों के लिए, ड्यू डेट का इस्तेमाल किया जा सकता है. इससे, मौजूदा तारीख के सबसे करीब वाली तारीख वाले आइटम की रैंक ज़्यादा होगी.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
freshnessDuration का इस्तेमाल करके, यह तय किया जा सकता है कि कोई आइटम कब पुराना माना जाएगा. 100 साल जैसी ज़्यादा वैल्यू सेट करने पर, अपडेट होने की फ़्रीक्वेंसी का असर खत्म हो जाता है. यह सेटिंग, स्टैटिक डेटा के लिए काम की है. जैसे, कर्मचारियों की प्रोफ़ाइल. खबरों के लिए, तीन दिन जैसी कम वैल्यू का इस्तेमाल करें.
क्वालिटी पर असर डालना
क्वालिटी से यह पता चलता है कि कोई आइटम कितना सटीक और काम का है. SearchQualityMetadata का इस्तेमाल करके, 0
से 1 के बीच कोई वैल्यू तय करें.
ज़्यादा वैल्यू सेट करने पर, रैंकिंग बेहतर होती है. उदाहरण के लिए, एचआर की ओर से लिखे गए फ़ायदों से जुड़े दस्तावेज़ों की रैंक बढ़ाई जा सकती है.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
फ़ील्ड टाइप का इस्तेमाल करके, रैंकिंग पर असर डालना
`OrderedRanking` का इस्तेमाल करके, enum या इंटिजर प्रॉपर्टी के आधार पर रैंकिंग पर असर डाला जा सकता है:
OrderedRanking
NO_ORDER(डिफ़ॉल्ट): रैंकिंग पर कोई असर नहीं पड़ता.ASCENDING: ज़्यादा वैल्यू सेट करने पर, रैंकिंग बेहतर होती है.DESCENDING: कम वैल्यू सेट करने पर, रैंकिंग बेहतर होती है.
गड़बड़ी की प्राथमिकता के लिए, DESCENDING का इस्तेमाल करें. इसके लिए, HIGH की वैल्यू 1 और LOW की वैल्यू 3 होनी चाहिए. votes प्रॉपर्टी के लिए, ASCENDING का इस्तेमाल करें.
क्वेरी के विस्तार की सुविधा का इस्तेमाल करके, रैंकिंग पर असर डालना
क्वेरी के विस्तार की सुविधा, नतीजों को बेहतर बनाने के लिए समानार्थी शब्दों और स्पेलिंग का इस्तेमाल करती है.
समानार्थी शब्दों का इस्तेमाल करना
Cloud Search, समानार्थी शब्दों के लिए सार्वजनिक वेब कॉन्टेंट का इस्तेमाल करता है. संगठन के हिसाब से खास शब्दावली के लिए, कस्टम समानार्थी शब्द भी तय किए जा सकते हैं. समानार्थी शब्द तय करना लेख देखें.
स्पेलिंग की सुविधा का इस्तेमाल करना
Cloud Search,
SpellResultमें स्पेलिंग के सुझाव देता है.
यह दस्तावेज़ ढूंढने के लिए, स्पेलिंग में की गई गड़बड़ियों को ठीक करने की सुविधा का इस्तेमाल, समानार्थी शब्दों के तौर पर भी करता है.
सर्च ऐप्लिकेशन की सेटिंग का इस्तेमाल करके, रैंकिंग पर असर डालना
सर्च ऐप्लिकेशन, कॉन्टेक्स्ट के हिसाब से जानकारी देता है. रैंकिंग पर असर डालने के लिए, इन सेटिंग का इस्तेमाल किया जा सकता है.
स्कोरिंग कॉन्फ़िगरेशन में बदलाव करना
अपडेट होने की फ़्रीक्वेंसी या दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने के लिए,
ScoringConfig
तय करें.
दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने पर, मालिक और इंटरैक्शन
के आधार पर मिलने वाले बूस्ट हट जाते हैं. खोज के अनुभव को पसंद के मुताबिक बनाना लेख देखें
.
सोर्स कॉन्फ़िगरेशन में बदलाव करना
डेटा सोर्स के लेवल पर सेटिंग तय करें:
- सोर्स की अहमियत:
HIGHअहमियत वाले सोर्स के आइटम की रैंक ज़्यादा होती है. - क्राउडिंग: एक ही सोर्स से मिलने वाले नतीजों की संख्या सीमित करता है. डिफ़ॉल्ट रूप से, यह संख्या तीन होती है, ताकि अलग-अलग सोर्स से नतीजे मिल सकें.
दिलचस्पी के हिसाब से कॉन्टेंट दिखाना
दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा, उपयोगकर्ता के आधार पर नतीजों को प्राथमिकता देती है:
- आइटम का मालिकाना हक: उपयोगकर्ता के मालिकाना हक वाले आइटम की रैंक बढ़ जाती है.
- आइटम से इंटरैक्शन: उपयोगकर्ता ने हाल ही में जिन आइटम को देखा, उनमें बदलाव किया या जिन पर टिप्पणी की उनकी रैंक बढ़ जाती है.
- उपयोगकर्ता के क्लिक: उपयोगकर्ता ने पहले जिन आइटम पर क्लिक किया उनकी रैंक बढ़ जाती है. नतीजे के यूआरएल में बदलाव न करें, क्योंकि इसका इस्तेमाल यह डेटा इकट्ठा करने के लिए किया जाता है.
क्वेरी की व्याख्या करना
क्वेरी की व्याख्या करना सुविधा, स्कीमा की डेफ़िनिशन का इस्तेमाल करके, उपयोगकर्ता की क्वेरी को स्ट्रक्चर्ड और ऑपरेटर पर आधारित क्वेरी में बदलती है. इससे कम कीवर्ड इस्तेमाल करने पर भी सटीक नतीजे मिलते हैं. क्वेरी की व्याख्या करने की सुविधा को बेहतर बनाने के लिए, स्कीमा का स्ट्रक्चर तैयार करना लेख देखें.
आइटम की भाषा
Cloud Search, उन आइटम की रैंक कम कर देता है जिनकी भाषा, क्वेरी की भाषा से मेल नहीं खाती. उपयोगकर्ता की पसंद के हिसाब से languageCode को
RequestOptions
सेट करें.
आइटम का कॉन्टेक्स्ट
contextAttributes
का इस्तेमाल करके, क्वेरी के कॉन्टेक्स्ट से जुड़े आइटम की रैंक बढ़ाई जा सकती है. जैसे, जगह या
विभाग.
आइटम की लोकप्रियता
Cloud Search, उन आइटम की रैंक बढ़ा देता है जिन पर उपयोगकर्ता, हाल की क्वेरी में अक्सर क्लिक करते हैं. खोज के नतीजों के यूआरएल में बदलाव न करें, क्योंकि इनका इस्तेमाल इन क्लिक को ट्रैक करने के लिए किया जाता है.
खोज की क्वालिटी से जुड़ी सेटिंग की खास जानकारी
यहां दी गई टेबल में, खोज की क्वालिटी से जुड़ी सेटिंग की खास जानकारी दी गई है:
स्कीमा सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
ItemContent |
ItemContent |
सुझाए गए | विषय के हिसाब से स्कोर |
RetrievalImportance |
RetrievalImportance |
सुझाए गए | विषय के हिसाब से स्कोर |
FreshnessOptions |
FreshnessOptions |
वैकल्पिक | अपडेट होने की फ़्रीक्वेंसी |
इंडेक्स करने की सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
सुझाए गए | अपडेट होने की फ़्रीक्वेंसी |
contentLanguage |
ItemMetadata |
सुझाए गए | आइटम की भाषा |
owners |
ItemAcl |
सुझाए गए | आइटम का मालिकाना हक |
| कस्टम समानार्थी शब्द | _dictionaryEntry |
सुझाए गए | समानार्थी शब्दों का इस्तेमाल करना |
quality |
SearchQualityMetadata |
वैकल्पिक | क्वालिटी पर असर डालना |
| इटरेक्शन डेटा | interaction |
वैकल्पिक | आइटम से इंटरैक्शन |
OrderedRanking |
OrderedRanking |
वैकल्पिक | फ़ील्ड टाइप |
सर्च ऐप्लिकेशन की सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
| दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करना | ScoringConfig |
सुझाए गए | दिलचस्पी के हिसाब से कॉन्टेंट दिखाना |
| सोर्स की अहमियत | SourceCrowdingConfig |
वैकल्पिक | सोर्स कॉन्फ़िगरेशन |
| क्राउडिंग | SourceCrowdingConfig |
वैकल्पिक | सोर्स कॉन्फ़िगरेशन |
अगले चरण
- क्वेरी की व्याख्या करने की सुविधा को बेहतर बनाने के लिए, स्कीमा का स्ट्रक्चर तैयार करना.
- समानार्थी शब्द तय करना.