समानार्थी शब्द (एक जैसे मतलब वाले) शब्द तय करें

किसी संगठन में खास शब्दावली या किसी सिद्धांत या चीज़ के बारे में बताने के कई तरीके आम तौर पर इस्तेमाल किए जाते हैं. खोज करते समय आइटम ढूंढने में उपयोगकर्ताओं की मदद करने के लिए, समानार्थी शब्दों को समझना चाहिए.

समानार्थी शब्द, _dictionaryEntry लोकप्रिय स्कीमा वाले आइटम को इंडेक्स करके तय किए जाते हैं.

_dictionaryEntry टाइप के आइटम में ये प्रॉपर्टी हो सकती हैं:

प्रॉपर्टी टाइप ब्यौरा ज़रूरी है?
_term string तय किया जाने वाला शब्द. सुझाई गई वैल्यू, ऐसे शब्द या वाक्यांश होते हैं जिन्हें हाइफ़न इस्तेमाल नहीं किया जा सकता. इनमें विराम चिह्न का इस्तेमाल नहीं होता. ज़रूरी है
_synonym string (repeated) _term में बताई गई स्ट्रिंग से मिलती-जुलती क्वेरी में शामिल किए जाने वाले वैकल्पिक शब्द. ज़रूरी है
_onlyApplicableForAttachedSearchApplications boolean इससे आपको डेटा सोर्स और खोज ऐप्लिकेशन के हिसाब से, समानार्थी शब्दों को ग्रुप करने की सुविधा मिलती है. ज़्यादा जानकारी के लिए, डेटा सोर्स के हिसाब से समानार्थी शब्द तय करना लेख पढ़ें. ज़रूरी नहीं है

जब कोई उपयोगकर्ता किसी क्वेरी में _term प्रॉपर्टी की वैल्यू शामिल करता है, तो प्रभावी क्वेरी "शब्द OR समानार्थी शब्द" बन जाती है. उदाहरण के लिए, अगर "scifi" शब्द को "science fiction" के साथ परिभाषित किया गया है, तो "scifi" शब्द वाली क्वेरी, "scifi" या "science fiction." वाले आइटम से मैच करती है

समानार्थी शब्द, दोनों तरफ़ से इस्तेमाल नहीं किए जा सकते. अगर क्वेरी के बजाय "science fiction," Cloud Search, क्वेरी के लिए कोई समानार्थी शब्द लागू नहीं करता है. क्वेरी सिर्फ़ उन आइटम से मेल खाती है जिनमें "scifi" वाले "science fiction." आइटम शामिल नहीं हैं.

सभी दोनों शब्दों को आपस में बदलने के लिए, हर शब्द को अलग-अलग परिभाषित करें:

टर्म समानार्थी शब्द
scifi science fiction
science fiction scifi

क्वेरी प्रोसेस करने के दौरान, समानार्थी शब्द लागू करने से पहले हाइफ़न और दूसरे विराम चिह्नों को हटा दिया जाता है. उपयोगकर्ता की क्वेरी "sci-fi", _term "sci fi." से मेल खाती है. जिन शब्दों को उपयोगकर्ता हाइफ़न लगा सकते हैं उनके लिए समानार्थी शब्द बनाने के लिए, सबसे पहले _term को सामान्य बनाएं, ताकि हाइफ़न के बजाय खाली सफ़ेद जगह का इस्तेमाल किया जा सके.

आगे दिए गए उदाहरण में, नीचे दी गई डेफ़िनिशन, उपयोगकर्ता की क्वेरी से मैच करती हैं और उन्हें "sci-fi," "sci fi," "scifi," और "science fiction" को आपस में बदला जा सकता है:

टर्म समानार्थी शब्द
scifi science fiction, sci fi
sci fi science fiction, scifi
science fiction scifi, sci fi

डिफ़ॉल्ट रूप से, किसी भी डेटा सोर्स में समानार्थी शब्द पूरे डोमेन पर लागू होते हैं. खास तौर पर, समानार्थी शब्दों को खोज ऐप्लिकेशन में सभी खोजों के लिए लागू किया जाता है, चाहे डेटा सोर्स कुछ भी हो. अगर आपको डेटा सोर्स के हिसाब से समानार्थी शब्द चाहिए, तो डेटा सोर्स के हिसाब से समानार्थी शब्द तय करना लेख पढ़ें.

Cloud Search SDK टूल का इस्तेमाल करके, दुनिया भर में एक जैसे मतलब देने वाले समानार्थी शब्दों को परिभाषित करना

शब्दों और उनके समानार्थी शब्दों को तय करने के लिए, Content Connector SDK टूल का इस्तेमाल किया जा सकता है. कनेक्टर बनाने के निर्देशों के लिए, कॉन्टेंट कनेक्टर बनाना लेख पढ़ें.

नीचे दिए गए स्निपेट में, CSV फ़ाइल रिकॉर्ड के आधार पर शब्द और समानार्थी शब्द को दिखाने वाला RepositoryDoc बनाया गया है:

DictionaryConnector.java
/**
 * Creates a document for indexing.
 *
 * For this connector sample, the created document is domain public
 *  searchable. The content is a simple text string.
 *
 * @param record The current CSV record to convert
 * @return the fully formed document ready for indexing
 */
private ApiOperation buildDocument(CSVRecord record) {
  // Extract term and synonyms from record
  String term = record.get(0);
  List<String> synonyms = StreamSupport.stream(record.spliterator(), false)
      .skip(1) // Skip term
      .collect(Collectors.toList());

  Multimap<String, Object> structuredData = ArrayListMultimap.create();
  structuredData.put("_term", term);
  structuredData.putAll("_synonym", synonyms);

  if (Configuration.getBoolean("dictionary.attachedToSearchApp", false).get()) {
    structuredData.put("_onlyApplicableForAttachedSearchApplications", true);
  }

  String itemName = String.format("dictionary/%s", term);

  // Using the SDK item builder class to create the item
  Item item =
      IndexingItemBuilder.fromConfiguration(itemName)
          .setItemType(IndexingItemBuilder.ItemType.CONTENT_ITEM)
          .setObjectType("_dictionaryEntry")
          .setValues(structuredData)
          .setAcl(DOMAIN_PUBLIC_ACL)
          .build();

  // Create the fully formed document
  return new RepositoryDoc.Builder()
      .setItem(item)
      .build();
}

समानार्थी शब्द तय करते समय, इन बातों का ध्यान रखें:

  • डोमेन सार्वजनिक होना ज़रूरी है. पिछले उदाहरण में, एसीएल को DOMAIN_PUBLIC_ACL पर सेट करके ऐसा किया गया है.
  • आपकी कॉन्फ़िगरेशन फ़ाइल के लिए इन प्रॉपर्टी के बारे में नहीं बताना चाहिए, क्योंकि ये आपके कोड में डोमेन की सार्वजनिक सेटिंग को बदल देती हैं:
    • defaultAcl.mode=FALLBACK
    • defaultAcl.public=true

खोज ऐप्लिकेशन के लिए खास समानार्थी शब्द तय करना

डिफ़ॉल्ट रूप से, समानार्थी शब्द सभी खोज ऐप्लिकेशन के सभी डेटा स्रोतों पर लागू होते हैं.

हालांकि, मान लें कि आपके संगठन में अलग-अलग इंजीनियरिंग और सेल्स टीम हैं और आपको हर टीम को अलग-अलग खोज अनुभव देना है, जिसमें नौकरी के लिए खास तौर पर बने समानार्थी शब्द शामिल हैं. इस मामले में, इंजीनियरिंग-विशिष्ट डेटा स्रोत और समानार्थी शब्दों वाला एक खोज ऐप्लिकेशन बनाया जा सकता है और दूसरा खोज ऐप्लिकेशन बनाया जा सकता है, जिसमें बिक्री के डेटा स्रोत और समानार्थी शब्द हों. इस लक्ष्य को पूरा करने के लिए, _onlyApplicableForAttachedSearchApplications=true का इस्तेमाल करके किसी खास डेटा सोर्स में, समानार्थी शब्दों को इंडेक्स करें. इस सेटिंग से समानार्थी शब्द सीमित हो जाते हैं, जैसे कि उन्हें सिर्फ़ उन सर्च ऐप्लिकेशन पर लागू किया जाता है जिनमें कोई खास डेटा सोर्स शामिल होता है.

उदाहरण के लिए, कोड की नीचे दी गई लाइन को पिछले कोड सैंपल में जोड़ने से, यह पक्का हो जाता है कि इंडेक्स किए गए समानार्थी शब्द, डेटा सोर्स के हिसाब से हैं:

structuredData.put("_onlyApplicableForAttachedSearchApplications", true);