खोज की क्वालिटी को बेहतर बनाएं

खोज के नतीजों की क्वालिटी से मतलब है कि उपयोगकर्ता को खोज के नतीजे, रैंकिंग और रिकॉल के हिसाब से कैसे लगे.

रैंकिंग, आइटम का क्रम है. वहीं, रीकॉल, खोजे गए काम के आइटम की संख्या है. आइटम (या दस्तावेज़) ऐसा डिजिटल कॉन्टेंट होता है जिसे Google Cloud Search इंडेक्स कर सकता है. जैसे, Microsoft Office के दस्तावेज़, PDF फ़ाइलें, डेटाबेस की लाइनें या यूनीक यूआरएल. किसी आइटम में ये चीज़ें शामिल होती हैं:

  • स्ट्रक्चर्ड मेटाडेटा
  • इंडेक्स किया जा सकने वाला कॉन्टेंट
  • ACL

Cloud Search, नतीजे पाने और उन्हें रैंक करने के लिए अलग-अलग सिग्नल का इस्तेमाल करता है. स्कीमा, आइटम के कॉन्टेंट और मेटाडेटा, और खोज के लिए इस्तेमाल किए जाने वाले ऐप्लिकेशन में मौजूद सेटिंग की मदद से, इन सिग्नल पर असर डाला जा सकता है. इस दस्तावेज़ में, सिग्नल इन्फ़्लुएंसर में बदलाव करके, खोज के नतीजों की क्वालिटी को बेहतर बनाने का तरीका बताया गया है.

सेटिंग की खास जानकारी के लिए, खोज के नतीजों की क्वालिटी से जुड़ी सेटिंग की खास जानकारी देखें.

विषय के हिसाब से स्कोर पर असर डालता है

विषय के हिसाब से नतीजे का मतलब है कि खोज के नतीजे, क्वेरी में इस्तेमाल किए गए शब्दों से कितने मिलते-जुलते हैं. Cloud Search, विषय की जानकारी के आधार पर स्कोर का हिसाब इन चीज़ों के आधार पर लगाता है:

  • क्वेरी के हर शब्द की अहमियत.
  • हिट की संख्या (कॉन्टेंट या मेटाडेटा में क्वेरी टर्म कितनी बार दिखता है).
  • क्वेरी टर्म और इंडेक्स किए गए आइटम के बीच मैच टाइप.

किसी टेक्स्ट प्रॉपर्टी के विषय के हिसाब से स्कोर पर असर डालने के लिए, अपने स्कीमा में RetrievalImportance को तय करें. ज़्यादा RetrievalImportance वाली प्रॉपर्टी से मैच होने पर, आपको ज़्यादा स्कोर मिलता है.

उदाहरण के लिए, अगर आपने सॉफ़्टवेयर में हुई गड़बड़ियों का इतिहास सेव किया है, तो उपयोगकर्ता गड़बड़ी के नाम से क्वेरी कर सकते हैं. नाम के लिए RetrievalImportance को HIGHEST पर सेट करें. ब्यौरे के लिए, DEFAULT इस्तेमाल करें.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

एचटीएमएल दस्तावेज़ों के लिए, <title> और <h1> जैसे टैग, शब्द की अहमियत का पता लगाने में मदद करते हैं. अगर ContentFormat की वैल्यू TEXT है, तो ItemContent एट्रिब्यूट के लिए DEFAULT वैल्यू का इस्तेमाल किया जाता है. अगर यह HTML है, तो अहमियत एचटीएमएल प्रॉपर्टी पर निर्भर करती है.

डेटा अपडेट होने की फ़्रीक्वेंसी

अप-टू-डेट होने की स्थिति से पता चलता है कि किसी आइटम में हाल ही में कब बदलाव किया गया था. इसके लिए, ItemMetadata में createTime और updateTime का इस्तेमाल किया जाता है. पुराने आइटम को कम रैंक मिलती है.

FreshnessOptions में freshnessProperty और freshnessDuration को बदलकर, फ़्रेशनेस को बदला जा सकता है. freshnessProperty की मदद से, updateTime के बजाय अपनी पसंद के मुताबिक तारीख या टाइमस्टैंप का इस्तेमाल किया जा सकता है. बग के लिए, समयसीमा का इस्तेमाल किया जा सकता है, ताकि जिन आइटम की तारीखें अभी की तारीख के सबसे करीब हैं उन्हें ज़्यादा रैंक मिले.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

freshnessDuration का इस्तेमाल करके यह बताएं कि किसी आइटम को कब पुराना माना जाता है. ज़्यादा वैल्यू, जैसे कि 100 साल, नयापन दिखाने की सुविधा को बंद कर देती है. यह कर्मचारी की प्रोफ़ाइल जैसे स्टैटिक डेटा के लिए फ़ायदेमंद है. खबरों के लिए, कम समयसीमा वाली वैल्यू का इस्तेमाल करें. जैसे, तीन दिन.

क्वालिटी पर असर डालने वाले फ़ैक्टर

क्वालिटी से पता चलता है कि कोई आइटम कितना सटीक है और कितना काम का है. SearchQualityMetadata का इस्तेमाल करके, 0 और 1 के बीच की कोई वैल्यू डालें. ज़्यादा वैल्यू से रैंकिंग बेहतर होती है. उदाहरण के लिए, एचआर की ओर से बनाए गए फ़ायदों से जुड़े दस्तावेज़ों को बढ़ावा दिया जा सकता है.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

फ़ील्ड टाइप का इस्तेमाल करके असर

OrderedRanking का इस्तेमाल करके, enum या पूर्णांक प्रॉपर्टी के आधार पर रैंकिंग पर असर डाला जा सकता है:

  • NO_ORDER (डिफ़ॉल्ट): इससे रैंकिंग पर कोई असर नहीं पड़ता.
  • ASCENDING: ज़्यादा वैल्यू से रैंकिंग बेहतर होती है.
  • DESCENDING: कम वैल्यू से रैंकिंग बेहतर होती है.

बग की प्राथमिकता के लिए, DESCENDING का इस्तेमाल करें. ऐसा तब करें, जब HIGH की वैल्यू 1 और LOW की वैल्यू 3 हो. votes प्रॉपर्टी के लिए, ASCENDING का इस्तेमाल करें.

क्वेरी को बड़ा करके रैंकिंग पर असर डालना

क्वेरी एक्सपैंशन की सुविधा, समानार्थी शब्दों और स्पेलिंग का इस्तेमाल करके नतीजों को बेहतर बनाती है.

समानार्थक शब्दों का प्रयोगउपयोग करें

Cloud Search, समानार्थी शब्दों के लिए सार्वजनिक वेब कॉन्टेंट का इस्तेमाल करता है. संगठन के हिसाब से इस्तेमाल होने वाली शब्दावली के लिए, कस्टम समानार्थी शब्द भी तय किए जा सकते हैं. समानार्थक शब्द तय करना लेख पढ़ें.

स्पेलिंग का इस्तेमाल करना

Cloud Search, SpellResult में स्पेलिंग के सुझाव देता है. यह दस्तावेज़ों को ढूंढने के लिए, वर्तनी में हुई गलतियों को समानार्थी शब्दों के तौर पर भी इस्तेमाल करता है.

Search ऐप्लिकेशन की सेटिंग के ज़रिए रैंकिंग पर असर डालना

Search Application, कॉन्टेक्स्ट के हिसाब से जानकारी देता है. इन सेटिंग का इस्तेमाल करके, रैंकिंग पर असर डाला जा सकता है.

स्कोरिंग कॉन्फ़िगरेशन में बदलाव करना

फ़्रेशनेस या दिलचस्पी के मुताबिक विज्ञापन दिखाने की सुविधा बंद करने के लिए, ScoringConfig तय करें. दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने पर, मालिक और इंटरैक्शन बूस्ट हट जाते हैं. खोज के अनुभव को पसंद के मुताबिक बनाना लेख पढ़ें.

सोर्स कॉन्फ़िगरेशन में बदलाव करना

डेटा सोर्स लेवल की सेटिंग तय करें:

  • सोर्स का महत्व: HIGH महत्व वाले सोर्स से मिले आइटम को ज़्यादा रैंक मिलती है.
  • क्राउडिंग: यह सुविधा, एक ही सोर्स से मिले नतीजों की संख्या को सीमित करती है. डिफ़ॉल्ट रूप से, यह संख्या तीन होती है. इससे यह पक्का किया जाता है कि नतीजे अलग-अलग सोर्स से मिले हों.

मनमुताबिक बनाना

मनमुताबिक बनाने की सुविधा, उपयोगकर्ता के हिसाब से नतीजों को प्राथमिकता देती है:

  • आइटम का मालिकाना हक: इससे उपयोगकर्ता के मालिकाना हक वाले आइटम को बढ़ावा मिलता है.
  • आइटम के साथ इंटरैक्शन: इससे उन आइटम को बढ़ावा मिलता है जिन्हें उपयोगकर्ता ने हाल ही में देखा है, जिनमें बदलाव किया है या जिन पर टिप्पणी की है.
  • उपयोगकर्ता के क्लिक: इससे उन आइटम को बढ़ावा मिलता है जिन पर उपयोगकर्ता ने पहले क्लिक किया था. नतीजे के यूआरएल में बदलाव न करें, क्योंकि इसका इस्तेमाल यह डेटा इकट्ठा करने के लिए किया जाता है.

क्वेरी इंटरप्रिटेशन

क्वेरी इंटरप्रिटेशन सुविधा, स्कीमा की परिभाषाओं का इस्तेमाल करके उपयोगकर्ता की क्वेरी को स्ट्रक्चर्ड और ऑपरेटर पर आधारित क्वेरी में बदलती है. इससे कम कीवर्ड होने पर भी सटीक नतीजे मिलते हैं. क्वेरी को सही तरीके से समझने के लिए स्कीमा बनाना लेख पढ़ें.

आइटम की भाषा

Cloud Search, उन आइटम को कम प्राथमिकता देता है जिनकी भाषा, क्वेरी की भाषा से मेल नहीं खाती. RequestOptions में languageCode को उपयोगकर्ता की पसंद के मुताबिक सेट करें.

आइटम का कॉन्टेक्स्ट

क्वेरी के कॉन्टेक्स्ट से जुड़े आइटम की रैंकिंग बढ़ाने के लिए, contextAttributes का इस्तेमाल करें. जैसे, जगह या विभाग.

आइटम की लोकप्रियता

Cloud Search, उन आइटम को बढ़ावा देता है जिन पर उपयोगकर्ता हाल ही की क्वेरी में अक्सर क्लिक करते हैं. खोज के नतीजों में दिखने वाले यूआरएल में बदलाव न करें, क्योंकि इनका इस्तेमाल इन क्लिक को ट्रैक करने के लिए किया जाता है.

खोज की क्वालिटी से जुड़ी सेटिंग के बारे में खास जानकारी

यहां दी गई टेबल में, खोज के नतीजों की क्वालिटी से जुड़ी सेटिंग के बारे में खास जानकारी दी गई है:

स्कीमा सेटिंग

सेटिंग जगह सुझाव विवरण
ItemContent ItemContent सुझाए गए विषय की जानकारी
RetrievalImportance RetrievalImportance सुझाए गए विषय की जानकारी
FreshnessOptions FreshnessOptions वैकल्पिक डेटा अपडेट होने की फ़्रीक्वेंसी

इंडेक्सिंग की सेटिंग

सेटिंग जगह सुझाव विवरण
createTime/updateTime ItemMetadata सुझाए गए डेटा अपडेट होने की फ़्रीक्वेंसी
contentLanguage ItemMetadata सुझाए गए आइटम की भाषा
owners ItemAcl सुझाए गए आइटम का मालिकाना हक
कस्टम सिनोनिम _dictionaryEntry सुझाए गए समानार्थी शब्दों का इस्तेमाल करना
quality SearchQualityMetadata वैकल्पिक क्वालिटी पर असर
इटरेक्शन डेटा interaction वैकल्पिक आइटम से इंटरैक्शन
OrderedRanking OrderedRanking वैकल्पिक फ़ील्ड टाइप

ऐप्लिकेशन की सेटिंग खोजना

सेटिंग जगह सुझाव विवरण
वैयक्तिकरण अक्षम करें ScoringConfig सुझाए गए मनमुताबिक बनाने की सुविधा
सोर्स का महत्व SourceCrowdingConfig वैकल्पिक सोर्स कॉन्फ़िगरेशन
क्राउडिंग SourceCrowdingConfig वैकल्पिक सोर्स कॉन्फ़िगरेशन

अगले चरण

  1. क्वेरी को सही तरीके से समझने के लिए स्कीमा बनाएं.
  2. समानार्थी शब्दों के बारे में बताओ.