खोज के नतीजों की क्वालिटी से मतलब है कि उपयोगकर्ता को खोज के नतीजे, रैंकिंग और रिकॉल के हिसाब से कैसे लगे.
रैंकिंग, आइटम का क्रम है. वहीं, रीकॉल, खोजे गए काम के आइटम की संख्या है. आइटम (या दस्तावेज़) ऐसा डिजिटल कॉन्टेंट होता है जिसे Google Cloud Search इंडेक्स कर सकता है. जैसे, Microsoft Office के दस्तावेज़, PDF फ़ाइलें, डेटाबेस की लाइनें या यूनीक यूआरएल. किसी आइटम में ये चीज़ें शामिल होती हैं:
- स्ट्रक्चर्ड मेटाडेटा
- इंडेक्स किया जा सकने वाला कॉन्टेंट
- ACL
Cloud Search, नतीजे पाने और उन्हें रैंक करने के लिए अलग-अलग सिग्नल का इस्तेमाल करता है. स्कीमा, आइटम के कॉन्टेंट और मेटाडेटा, और खोज के लिए इस्तेमाल किए जाने वाले ऐप्लिकेशन में मौजूद सेटिंग की मदद से, इन सिग्नल पर असर डाला जा सकता है. इस दस्तावेज़ में, सिग्नल इन्फ़्लुएंसर में बदलाव करके, खोज के नतीजों की क्वालिटी को बेहतर बनाने का तरीका बताया गया है.
सेटिंग की खास जानकारी के लिए, खोज के नतीजों की क्वालिटी से जुड़ी सेटिंग की खास जानकारी देखें.
विषय के हिसाब से स्कोर पर असर डालता है
विषय के हिसाब से नतीजे का मतलब है कि खोज के नतीजे, क्वेरी में इस्तेमाल किए गए शब्दों से कितने मिलते-जुलते हैं. Cloud Search, विषय की जानकारी के आधार पर स्कोर का हिसाब इन चीज़ों के आधार पर लगाता है:
- क्वेरी के हर शब्द की अहमियत.
- हिट की संख्या (कॉन्टेंट या मेटाडेटा में क्वेरी टर्म कितनी बार दिखता है).
- क्वेरी टर्म और इंडेक्स किए गए आइटम के बीच मैच टाइप.
किसी टेक्स्ट प्रॉपर्टी के विषय के हिसाब से स्कोर पर असर डालने के लिए, अपने स्कीमा में RetrievalImportance को तय करें. ज़्यादा RetrievalImportance वाली प्रॉपर्टी से मैच होने पर, आपको ज़्यादा स्कोर मिलता है.
उदाहरण के लिए, अगर आपने सॉफ़्टवेयर में हुई गड़बड़ियों का इतिहास सेव किया है, तो उपयोगकर्ता गड़बड़ी के नाम से क्वेरी कर सकते हैं.
नाम के लिए RetrievalImportance को HIGHEST पर सेट करें. ब्यौरे के लिए, DEFAULT इस्तेमाल करें.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
एचटीएमएल दस्तावेज़ों के लिए, <title> और <h1> जैसे टैग, शब्द की अहमियत का पता लगाने में मदद करते हैं. अगर ContentFormat की वैल्यू TEXT है, तो ItemContent एट्रिब्यूट के लिए DEFAULT वैल्यू का इस्तेमाल किया जाता है. अगर यह HTML है, तो अहमियत एचटीएमएल प्रॉपर्टी पर निर्भर करती है.
डेटा अपडेट होने की फ़्रीक्वेंसी
अप-टू-डेट होने की स्थिति से पता चलता है कि किसी आइटम में हाल ही में कब बदलाव किया गया था. इसके लिए, ItemMetadata में createTime और updateTime का इस्तेमाल किया जाता है.
पुराने आइटम को कम रैंक मिलती है.
FreshnessOptions में freshnessProperty और freshnessDuration को बदलकर, फ़्रेशनेस को बदला जा सकता है.
freshnessProperty की मदद से, updateTime के बजाय अपनी पसंद के मुताबिक तारीख या टाइमस्टैंप का इस्तेमाल किया जा सकता है. बग के लिए, समयसीमा का इस्तेमाल किया जा सकता है, ताकि जिन आइटम की तारीखें अभी की तारीख के सबसे करीब हैं उन्हें ज़्यादा रैंक मिले.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
freshnessDuration का इस्तेमाल करके यह बताएं कि किसी आइटम को कब पुराना माना जाता है. ज़्यादा वैल्यू, जैसे कि 100 साल, नयापन दिखाने की सुविधा को बंद कर देती है. यह कर्मचारी की प्रोफ़ाइल जैसे स्टैटिक डेटा के लिए फ़ायदेमंद है. खबरों के लिए, कम समयसीमा वाली वैल्यू का इस्तेमाल करें. जैसे, तीन दिन.
क्वालिटी पर असर डालने वाले फ़ैक्टर
क्वालिटी से पता चलता है कि कोई आइटम कितना सटीक है और कितना काम का है. SearchQualityMetadata का इस्तेमाल करके, 0 और 1 के बीच की कोई वैल्यू डालें.
ज़्यादा वैल्यू से रैंकिंग बेहतर होती है. उदाहरण के लिए, एचआर की ओर से बनाए गए फ़ायदों से जुड़े दस्तावेज़ों को बढ़ावा दिया जा सकता है.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
फ़ील्ड टाइप का इस्तेमाल करके असर
OrderedRanking का इस्तेमाल करके, enum या पूर्णांक प्रॉपर्टी के आधार पर रैंकिंग पर असर डाला जा सकता है:
NO_ORDER(डिफ़ॉल्ट): इससे रैंकिंग पर कोई असर नहीं पड़ता.ASCENDING: ज़्यादा वैल्यू से रैंकिंग बेहतर होती है.DESCENDING: कम वैल्यू से रैंकिंग बेहतर होती है.
बग की प्राथमिकता के लिए, DESCENDING का इस्तेमाल करें. ऐसा तब करें, जब HIGH की वैल्यू 1 और LOW की वैल्यू 3 हो. votes प्रॉपर्टी के लिए, ASCENDING का इस्तेमाल करें.
क्वेरी को बड़ा करके रैंकिंग पर असर डालना
क्वेरी एक्सपैंशन की सुविधा, समानार्थी शब्दों और स्पेलिंग का इस्तेमाल करके नतीजों को बेहतर बनाती है.
समानार्थक शब्दों का प्रयोगउपयोग करें
Cloud Search, समानार्थी शब्दों के लिए सार्वजनिक वेब कॉन्टेंट का इस्तेमाल करता है. संगठन के हिसाब से इस्तेमाल होने वाली शब्दावली के लिए, कस्टम समानार्थी शब्द भी तय किए जा सकते हैं. समानार्थक शब्द तय करना लेख पढ़ें.
स्पेलिंग का इस्तेमाल करना
Cloud Search, SpellResult में स्पेलिंग के सुझाव देता है.
यह दस्तावेज़ों को ढूंढने के लिए, वर्तनी में हुई गलतियों को समानार्थी शब्दों के तौर पर भी इस्तेमाल करता है.
Search ऐप्लिकेशन की सेटिंग के ज़रिए रैंकिंग पर असर डालना
Search Application, कॉन्टेक्स्ट के हिसाब से जानकारी देता है. इन सेटिंग का इस्तेमाल करके, रैंकिंग पर असर डाला जा सकता है.
स्कोरिंग कॉन्फ़िगरेशन में बदलाव करना
फ़्रेशनेस या दिलचस्पी के मुताबिक विज्ञापन दिखाने की सुविधा बंद करने के लिए, ScoringConfig तय करें.
दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने पर, मालिक और इंटरैक्शन बूस्ट हट जाते हैं. खोज के अनुभव को पसंद के मुताबिक बनाना लेख पढ़ें.
सोर्स कॉन्फ़िगरेशन में बदलाव करना
डेटा सोर्स लेवल की सेटिंग तय करें:
- सोर्स का महत्व:
HIGHमहत्व वाले सोर्स से मिले आइटम को ज़्यादा रैंक मिलती है. - क्राउडिंग: यह सुविधा, एक ही सोर्स से मिले नतीजों की संख्या को सीमित करती है. डिफ़ॉल्ट रूप से, यह संख्या तीन होती है. इससे यह पक्का किया जाता है कि नतीजे अलग-अलग सोर्स से मिले हों.
मनमुताबिक बनाना
मनमुताबिक बनाने की सुविधा, उपयोगकर्ता के हिसाब से नतीजों को प्राथमिकता देती है:
- आइटम का मालिकाना हक: इससे उपयोगकर्ता के मालिकाना हक वाले आइटम को बढ़ावा मिलता है.
- आइटम के साथ इंटरैक्शन: इससे उन आइटम को बढ़ावा मिलता है जिन्हें उपयोगकर्ता ने हाल ही में देखा है, जिनमें बदलाव किया है या जिन पर टिप्पणी की है.
- उपयोगकर्ता के क्लिक: इससे उन आइटम को बढ़ावा मिलता है जिन पर उपयोगकर्ता ने पहले क्लिक किया था. नतीजे के यूआरएल में बदलाव न करें, क्योंकि इसका इस्तेमाल यह डेटा इकट्ठा करने के लिए किया जाता है.
क्वेरी इंटरप्रिटेशन
क्वेरी इंटरप्रिटेशन सुविधा, स्कीमा की परिभाषाओं का इस्तेमाल करके उपयोगकर्ता की क्वेरी को स्ट्रक्चर्ड और ऑपरेटर पर आधारित क्वेरी में बदलती है. इससे कम कीवर्ड होने पर भी सटीक नतीजे मिलते हैं. क्वेरी को सही तरीके से समझने के लिए स्कीमा बनाना लेख पढ़ें.
आइटम की भाषा
Cloud Search, उन आइटम को कम प्राथमिकता देता है जिनकी भाषा, क्वेरी की भाषा से मेल नहीं खाती. RequestOptions में languageCode को उपयोगकर्ता की पसंद के मुताबिक सेट करें.
आइटम का कॉन्टेक्स्ट
क्वेरी के कॉन्टेक्स्ट से जुड़े आइटम की रैंकिंग बढ़ाने के लिए, contextAttributes का इस्तेमाल करें. जैसे, जगह या विभाग.
आइटम की लोकप्रियता
Cloud Search, उन आइटम को बढ़ावा देता है जिन पर उपयोगकर्ता हाल ही की क्वेरी में अक्सर क्लिक करते हैं. खोज के नतीजों में दिखने वाले यूआरएल में बदलाव न करें, क्योंकि इनका इस्तेमाल इन क्लिक को ट्रैक करने के लिए किया जाता है.
खोज की क्वालिटी से जुड़ी सेटिंग के बारे में खास जानकारी
यहां दी गई टेबल में, खोज के नतीजों की क्वालिटी से जुड़ी सेटिंग के बारे में खास जानकारी दी गई है:
स्कीमा सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
ItemContent |
ItemContent |
सुझाए गए | विषय की जानकारी |
RetrievalImportance |
RetrievalImportance |
सुझाए गए | विषय की जानकारी |
FreshnessOptions |
FreshnessOptions |
वैकल्पिक | डेटा अपडेट होने की फ़्रीक्वेंसी |
इंडेक्सिंग की सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
सुझाए गए | डेटा अपडेट होने की फ़्रीक्वेंसी |
contentLanguage |
ItemMetadata |
सुझाए गए | आइटम की भाषा |
owners |
ItemAcl |
सुझाए गए | आइटम का मालिकाना हक |
| कस्टम सिनोनिम | _dictionaryEntry |
सुझाए गए | समानार्थी शब्दों का इस्तेमाल करना |
quality |
SearchQualityMetadata |
वैकल्पिक | क्वालिटी पर असर |
| इटरेक्शन डेटा | interaction |
वैकल्पिक | आइटम से इंटरैक्शन |
OrderedRanking |
OrderedRanking |
वैकल्पिक | फ़ील्ड टाइप |
ऐप्लिकेशन की सेटिंग खोजना
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
| वैयक्तिकरण अक्षम करें | ScoringConfig |
सुझाए गए | मनमुताबिक बनाने की सुविधा |
| सोर्स का महत्व | SourceCrowdingConfig |
वैकल्पिक | सोर्स कॉन्फ़िगरेशन |
| क्राउडिंग | SourceCrowdingConfig |
वैकल्पिक | सोर्स कॉन्फ़िगरेशन |