कॉन्फ़िगरेशन फ़ाइलों की मदद से Programmable Search Engine बनाना

इस पेज पर, Programmable Search Engine की कॉन्फ़िगरेशन फ़ाइलों के बुनियादी सिद्धांतों के बारे में बताया गया है.

  1. खास जानकारी
  2. Programmable Search Engine में क्या होता है
  3. कॉम्पोनेंट एक साथ कैसे काम करते हैं
  4. सर्च इंजन बनाना
  5. Programmable Search Engine फ़ाइलों में बदलाव करना
  6. सही फ़ॉर्मैट चुनना

खास जानकारी

अगर कंट्रोल पैनल आपको ज़रूरत के मुताबिक कस्टमाइज़ेशन नहीं करता है, तो Programmable Search के एक्सएमएल फ़ॉर्मैट का इस्तेमाल करें. यह आपको ज़्यादा कंट्रोल, विकल्प, और ज़्यादा असरदार सुविधाओं का ऐक्सेस देता है.

Programmable Search Engine की कॉन्फ़िगरेशन फ़ाइलों का इस्तेमाल करने के लिए, Programmable Search Engine कंट्रोल पैनल का इस्तेमाल करके, बेसिक सर्च इंजन बनाना शुरू करें. अपना खोज इंजन बना लेने के बाद, आप कंट्रोल पैनल के खास जानकारी पेज से अपने एनोटेशन और संदर्भ XML फ़ाइलें डाउनलोड कर सकते हैं.

एक्सएमएल की बुनियादी बातें

एक्सटेंसिबल मार्कअप लैंग्वेज या XML, अलग-अलग कामों के लिए इस्तेमाल की जाने वाली मार्कअप भाषा है. यह टैग वाला ऐसा लेख है जिसे आप पढ़ सकते हैं. उदाहरण के लिए, Programmable Search के एक्सएमएल फ़ॉर्मैट में ये टैग शामिल होते हैं: <Context> </Context> और <LookAndFeel> </LookAndFeel>.

किसी भी अन्य एक्सएमएल फ़ाइल की तरह, आपके Programmable Search Engine की खास जानकारी को, एक्सएमएल सिंटैक्स (<element attribute="value">content</element>) के हिसाब से होना चाहिए. साथ ही, वह सही फ़ॉर्मैट में होना चाहिए. एक्सएमएल के ये नियम हैं:

  • एक्सएमएल फ़ॉर्मैट के लिए ज़रूरी है कि आप अपने टॉप-लेवल टैग से पहले, एक्सएमएल की जानकारी (<?xml version="1.0"?>) का इस्तेमाल करें. हालांकि, Programmable Search Engine की कॉन्फ़िगरेशन फ़ाइल के लिए, ज़रूरत नहीं है.
  • आपके सभी एलिमेंट में, ओपनिंग टैग (<tag>) और क्लोज़िंग टैग (</tag>) होना ज़रूरी है.
  • आपके सभी टैग सही तरीके से नेस्ट किए गए होने चाहिए. आपके पास ऐसा एक्सएमएल कोड नहीं हो सकता: <sandwich><filling> peanut butter</sandwich></filling>. इसके बजाय, यह ऐसा होना चाहिए: <sandwich><filling> peanut butter</filling></sandwich>.
  • एक्सएमएल फ़ॉर्मैट, केस-सेंसिटिव (बड़े और छोटे अक्षरों में अंतर) होता है. इसलिए, निर्देशों में टैग के कैपिटल लेटर और स्पेलिंग का सही से पालन करें.
  • सभी एट्रिब्यूट की वैल्यू, डबल कोटेशन मार्क (<element attribute="value">) के अंदर होनी चाहिए.
  • सभी एट्रिब्यूट की जानकारी, ओपनिंग टैग (<element attribute="value">) में दी जानी चाहिए, न कि क्लोज़िंग टैग ( </element>) में.

टिप्पणी के टैग (<!-- your comment here -->) का इस्तेमाल करके, अपने लिए नोट लिखे जा सकते हैं. Programmable Search Engine, टेक्स्ट की उस लाइन को एक्सएमएल कोड के तौर पर पार्स नहीं करेगा. रिमाइंडर या जानकारी लिखने के अलावा, कुछ एक्सएमएल कोड को कुछ समय के लिए कमीशन से बाहर रखने के लिए टिप्पणियों का इस्तेमाल किया जा सकता है. ऐसा शायद इसलिए होता है, क्योंकि आपको कुछ इफ़ेक्ट आज़माने हैं या समस्याओं को हल करना है. हालांकि, ये टिप्पणियां उन फ़ाइलों में सुरक्षित नहीं की जाती हैं जिन्हें आप कंट्रोल पैनल से डाउनलोड करते हैं. अगर आप टिप्पणियां रखना चाहते हैं, तो आपको कंट्रोल पैनल में अपनी टिप्पणी की गई एक्सएमएल फ़ाइलों को अपलोड करने के बाद भी उनकी एक कॉपी रखनी चाहिए.

एक्सएमएल फ़ाइलें बनाने और उनमें बदलाव करने के लिए, सामान्य टेक्स्ट एडिटर का इस्तेमाल किया जा सकता है. बस टेक्स्ट फ़ाइल को फ़ाइल एक्सटेंशन .xml (उदाहरण के लिए, cse_badminton.xml) के साथ सेव करें.

वापस सबसे ऊपर जाएं

Programmable Search Engine में क्या होता है

Programmable Search Engine में दो मुख्य कॉम्पोनेंट होते हैं, जिनमें से हर एक को एक्सएमएल फ़ाइल से कंट्रोल किया जाता है:

  • कॉन्टेक्स्ट: कॉन्टेक्स्ट एक्सएमएल फ़ाइल, सर्च इंजन की बुनियादी सुविधाओं के बारे में बताती है. इससे सर्च इंजन की ग्लोबल सेटिंग के बारे में पता चलता है, जैसे कि इमेज सर्च या प्रमोशन की सुविधा चालू है या नहीं. हर सर्च इंजन की अपनी कॉन्टेक्स्ट फ़ाइल होती है. कॉन्टेक्स्ट एक्सएमएल फ़ाइल के बारे में ज़्यादा जानकारी. अपने सर्च इंजन के लिए सबसे सही फ़ाइल फ़ॉर्मैट चुनने के बारे में ज़्यादा जानने के लिए, सर्च इंजन के लिए सही फ़ॉर्मैट चुनना वाला लेख पढ़ें.
  • एनोटेशन: एनोटेशन की एक्सएमएल फ़ाइल उन वेबपेजों या वेबसाइटों की सूची बनाती है जिन्हें आपको अपने सर्च इंजन में शामिल करना है. साथ ही, यह भी बताती है कि आपके खोज नतीजों में इन साइटों को कैसे रैंक किया जाना चाहिए, इस बारे में आपकी कोई प्राथमिकता है. हर साइट और उससे जुड़ी जानकारी को एनोटेशन कहा जाता है. एनोटेशन एक्सएमएल फ़ाइल के बारे में ज़्यादा जानकारी.

हमारा सुझाव है कि आप इनमें से कोई भी फ़ाइल शुरू से न बनाएं. इसके बजाय, उन्हें कंट्रोल पैनल के खास जानकारी पेज से डाउनलोड करें.

इन मुख्य कॉम्पोनेंट के अलावा, सर्च इंजन में नीचे दी गई सहायक फ़ाइलें भी हो सकती हैं:

  • प्रमोशन: प्रमोशन की एक्सएमएल फ़ाइल, पहले से तय क्वेरी शब्दों के सेट से ट्रिगर होने वाले कस्टम नतीजों की सीरीज़ होती है. जब कोई उपयोगकर्ता ऐसी खोज टाइप करता है जो आपकी क्वेरी के लिए इस्तेमाल किए गए किसी शब्द से पूरी तरह मेल खाती है, तो प्रमोशन पेज में सबसे ऊपर दिखता है. प्रमोशन का इस्तेमाल, अपने उपयोगकर्ताओं की क्वेरी का सीधे जवाब देने, उन्हें अहम जानकारी देने या उन्हें ऐसे वेबपेजों पर ले जाने के लिए किया जा सकता है जो पेज पर सबसे ऊपर नहीं हैं, लेकिन खास तौर पर काम के हैं. कंट्रोल पैनल में, प्रमोशन को प्रमोशन टैब में दिखाया जाता है. प्रमोशन के बारे में ज़्यादा जानकारी.
  • समानार्थी शब्द: समानार्थी शब्द वाली एक्सएमएल फ़ाइल, खोज के लिए इस्तेमाल किए गए शब्द के वैरिएंट शामिल करने के लिए, आपके उपयोगकर्ताओं की क्वेरी को बड़ा करती है. उदाहरण के लिए, अगर आपका उपयोगकर्ता "सिमियन" खोजता है, सर्च इंजन "बंदर" भी खोजता है और "एप" है. कंट्रोल पैनल में, समानार्थी शब्द समानार्थी शब्द टैब में तय किए जाते हैं. समानार्थी शब्दों के बारे में ज़्यादा जानकारी.

कॉम्पोनेंट एक साथ कैसे काम करते हैं

संदर्भ एक्सएमएल फ़ाइल, इस्तेमाल के लिए एनोटेशन फ़ाइल के बारे में नहीं बताती और एनोटेशन एक्सएमएल, कॉन्टेक्स्ट फ़ाइल का कोई रेफ़रंस नहीं देता है. Programmable Search Engine, संदर्भ और एनोटेशन को जोड़ने के लिए, लेबल का इस्तेमाल करता है. संदर्भ एक्सएमएल फ़ाइल में सर्च इंजन की पहचान करने वाले लेबल शामिल होते हैं और एनोटेशन एक्सएमएल में दी गई हर जानकारी, एक या उससे ज़्यादा लेबल के साथ टैग की जाती है. इससे पता चलता है कि वह किस सर्च इंजन का है. अगर कॉन्टेक्स्ट फ़ाइल में लेबल का नाम बदला जाता है, तो आपको उस लेबल से टैग की गई सभी टिप्पणियां बदलनी होंगी.

हालांकि, आपके पास कई एनोटेशन फ़ाइलें अपलोड करने का विकल्प है, लेकिन कंट्रोल पैनल से डाउनलोड करने पर Programmable Search Engine, एनोटेशन की सभी फ़ाइलों को एक एनोटेशन फ़ाइल में मर्ज कर देता है. एनोटेशन फ़ाइलों की मदद से, अलग-अलग सर्च इंजन के लिए एक ही साइट को पसंद के मुताबिक बनाया जा सकता है. उदाहरण के लिए, एक सर्च इंजन अपनी खोज को कुछ साइटों तक सीमित कर सकता है, जबकि दूसरा उन साइटों को खत्म कर सकता है. वहीं, दूसरा सर्च इंजन उन साइटों का प्रमोशन कर सकता है.

context.xml

यहां event.xml फ़ाइल का एक उदाहरण दिया गया है जिसमें सर्च इंजन की पहचान करने वाले लेबल शामिल हैं, जिस पर वह लागू होती है:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

यहां एनोटेशन फ़ाइल का एक उदाहरण दिया गया है, जिसमें दिखाया गया है कि हर साइट (एनोटेशन) किसी लेबल से कैसे जुड़ी है:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

वापस सबसे ऊपर जाएं

बेहतर Programmable Search Engine बनाने की सुविधा

बेहतर इंजन बनाने के लिए, ये काम किए जा सकते हैं:

  1. अपनी ज़रूरतों के हिसाब से फ़ॉर्मैट तय करें.
  2. अपने सर्च इंजन के लिए खास बातें तय करें.
  3. Programmable Search Engine को बताएं कि कौनसी साइटें खोजनी हैं.
  4. Programmable Search Engine को खोज के नतीजों की रैंकिंग कैसे करनी है.

Programmable Search Engine की फ़ाइलों में बदलाव करना

एक्सएमएल फ़ाइल पर काम करने के लिए, कंट्रोल पैनल के खास जानकारी पेज से एक्सएमएल की खास बातें डाउनलोड करें. फ़ाइल को दोबारा शुरू न करें. तो निम्न कार्य करें:

  1. कंट्रोल पैनल के खास जानकारी पेज से संदर्भ फ़ाइल या एनोटेशन फ़ाइल डाउनलोड करें. खोज सुविधाएं सेक्शन में, डाउनलोड करें बटन पर क्लिक करें.
  2. ऐसे टेक्स्ट एडिटर का इस्तेमाल करें जो UNIX-स्टाइल लाइन एंडिंग को मैनेज कर सके (Wordpad, Emacs, और TextMate काम करता हो; Notepad ऐसे नहीं करता है). इस बात से कोई फ़र्क़ नहीं पड़ता कि आपने फ़ाइल को क्या नाम दिया है. जब तक फ़ाइल एक्सटेंशन .xml (उदाहरण के लिए, cx_global.xml) का इस्तेमाल करके उसे सेव किया जाता है, तब तक इस बात से कोई फ़र्क़ नहीं पड़ता
  3. डाउनलोड की गई फ़ाइल की एक बैकअप कॉपी बनाएं, हो सकता है कि आपने जो वर्शन बदला है वह उम्मीद के मुताबिक काम न करे और आपको पिछले वर्शन पर वापस जाना पड़े.

    अगर आप कॉपी नहीं बनाते हैं और आपने जिस वर्शन में बदलाव किया है वह ठीक से काम नहीं करता है, तो आपको अपनी फ़ाइल को डीबग करना होगा या अपना सर्च इंजन फिर से बनाना होगा. मज़ेदार नहीं है.

  4. इस एक्सएमएल फ़ाइल में बदलाव करें और उसे सेव करें. पक्का करें कि आपका टेक्स्ट एडिटर इस फ़ाइल को यूनिकोड टेक्स्ट दस्तावेज़ के तौर पर सेव कर रहा है, न कि किसी दूसरे फ़ाइल फ़ॉर्मैट के तौर पर.
  5. खास जानकारी वाले पेज पर, खोज सुविधाएं सेक्शन में जाकर फ़ाइल अपलोड करें.

सही फ़ॉर्मैट चुनना

Programmable Search Engine बनाने से पहले, यह तय कर लें कि आपकी ज़रूरत के हिसाब से कौनसा फ़ॉर्मैट सबसे अच्छा है. आपको ऐसा फ़ॉर्मैट नहीं चुनना चाहिए जो अपनी ज़रूरत के हिसाब से ज़्यादा असरदार और जटिल हो. साथ ही, आपको ऐसा फ़ॉर्मैट इस्तेमाल नहीं करना चाहिए जो जल्द ही पुराना हो जाए.

सही फ़ॉर्मैट चुनने के लिए, नीचे दी गई टेबल का इस्तेमाल करें.

बनाने के लिए इस्तेमाल करें क्योंकि सीमाएं ज़्यादा जानकारी
कम साइटों वाला एक या कुछ सर्च इंजन कंट्रोल पैनल टेक्स्ट एडिटर की मदद से फ़ाइलें बनाने और उन्हें अपलोड करने के बजाय, टेक्स्ट बॉक्स को भरकर, Programmable Search Engine को तुरंत बनाया जा सकता है. कंट्रोल पैनल का इस्तेमाल, Programmable Search Engine के बारे में जानने और कुछ साइटों का इस्तेमाल करके सर्च इंजन बनाने के लिए किया जाता है. शुरू करना
जटिल सर्च इंजन जो कई साइटों का इस्तेमाल करते हैं और फ़ीड का इस्तेमाल करते हैं कॉन्टेक्स्ट फ़ाइल और एनोटेशन की फ़ाइलें

Programmable Search Engine की फ़ाइलों की मदद से, सर्च इंजन को बेहतर तरीके से कंट्रोल किया जा सकता है. साथ ही, साइटों को तय करने और मैनेज करने के काम बहुत आसान हो जाते हैं.

भले ही आप संदर्भ और एनोटेशन फ़ाइलों का इस्तेमाल करके अपना खोज इंजन बनाने की योजना बना रहे हों, फिर भी कंट्रोल पैनल के बारे में खुद को जान लेना बेहतर होगा.

सर्च इंजन को जितना ज़्यादा कस्टमाइज़ किया जाएगा, यह उतना ही मुश्किल होता जाएगा. आपको Programmable Search एलिमेंट और एट्रिब्यूट को समझना होगा, जिन्हें चुनना मुश्किल नहीं है, लेकिन इनके लिए आपको कुछ समय देना होगा.

आपको डेवलपर गाइड का बाकी हिस्सा पढ़ना होगा, जो पढ़ने के लिए सबसे दिलचस्प कॉन्टेंट नहीं है.

कॉन्टेक्स्ट: सर्च इंजन की खास बातें तय करना और एनोटेशन: साइटें चुनना

वापस सबसे ऊपर जाएं