साइटमैप बनाना और उसे सबमिट करना

इस पेज पर साइटमैप बनाने और उसे Google के लिए उपलब्ध कराने का तरीका बताया गया है. अगर आपको साइटमैप के बारे में ज़्यादा जानकारी नहीं है, तो सबसे पहले हमारी गाइड पढ़ें.

Google, साइटमैप प्रोटोकॉल के हिसाब से बताए गए फ़ॉर्मैट के साथ काम करता है. हर साइटमैप के अपने फ़ायदे और नुकसान हैं. वह फ़ॉर्मैट चुनें जो आपकी साइट और सेटअप के लिए सबसे सही है (फ़ॉर्मैट को लेकर Google की कोई प्राथमिकता नहीं है). यहां दी गई टेबल में, साइटमैप के अलग-अलग फ़ॉर्मैट की तुलना की गई है:

साइटमैप की तुलना
एक्सएमएल साइटमैप

एक्सएमएल साइटमैप, साइटमैप के सभी फ़ॉर्मैट में से सबसे ज़्यादा खूबियों वाला साइटमैप है. इसमें आसानी से जानकारी शामिल की जा सकती है. इस साइटमैप में, इमेज, वीडियो, और खबरों वाले कॉन्टेंट के लिए अलग से डेटा शामिल किया जा सकता है. साथ ही, इसमें स्थानीय जगह के अनुसार बनाए गए पेज के वर्शन के लिए डेटा शामिल किया जा सकता है.

फ़ायदे:
  • ज़्यादा जानकारी शामिल की जा सकती है. साथ ही, बहुत सारी खूबियां हैं.
  • यह आपके यूआरएल के बारे में सबसे ज़्यादा जानकारी दे सकता है.
  • कॉन्टेंट मैनेजमेंट सिस्टम को इस्तेमाल करने वाले लोग, साइटमैप बनाने के लिए आसानी से प्लगिन ढूंढ सकते हैं.
नुकसान:
  • इसका इस्तेमाल करना मुश्किल हो सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैप करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
आरएसएस, एमआरएसएस, और ऐटम 1.0

आरएसएस, एमआरएसएस, और ऐटम 1.0 साइटमैप, एक्सएमएल साइटमैप की तरह ही होते हैं. हालांकि, इन्हें सबसे आसानी से उपलब्ध कराया जा सकता है, क्योंकि सीएमएस इन्हें अपने-आप बनाते हैं.

फ़ायदे:
  • ज़्यादातर सीएमएस, आरएसएस और ऐटम फ़ीड अपने-आप जनरेट करते हैं.
  • इसका इस्तेमाल, Google को आपके वीडियो के बारे में जानकारी देने के लिए किया जा सकता है.
नुकसान:
  • एचटीएमएल और इंडेक्स होने वाले अन्य पेजों के अलावा, यह सिर्फ़ वीडियो के बारे में जानकारी देता है, इमेज या खबरों के बारे में नहीं.
  • इसका इस्तेमाल करना मुश्किल हो सकता है.
टेक्स्ट साइटमैप

यह साइटमैप का सबसे आसान फ़ॉर्मैट है. इसमें सिर्फ़ एचटीएमएल और इंडेक्स किए जा सकने वाले दूसरे पेजों के यूआरएल लिस्ट किए जा सकते हैं.

फ़ायदे:

  • खास तौर पर, बड़ी साइटों पर काम करना आसान होता है.

नुकसान:

  • इसका इस्तेमाल, सिर्फ़ एचटीएमएल और इंडेक्स किए जा सकने वाले दूसरे पेजों के लिए ही किया जा सकता है.

साइटमैप इस्तेमाल करने के सबसे सही तरीके

साइटमैप तैयार करने के सबसे सही तरीके, साइटमैप प्रोटोकॉल से तय किए जाते हैं. सबसे ज़्यादा अनदेखा किए जाने वाले सबसे सही तरीके, साइज़ की सीमाओं, साइटमैप के मौजूद होने की जगह, और साइटमैप में शामिल यूआरएल से जुड़े हैं.

साइटमैप के साइज़ की सीमाएं: किसी भी फ़ॉर्मैट में साइटमैप का साइज़, 50 एमबी (बिना कंप्रेस किए) से ज़्यादा नहीं होना चाहिए या उसमें 50,000 से ज़्यादा यूआरएल मौजूद नहीं होने चाहिए. अगर आपकी साइट में 50,000 से ज़्यादा यूआरएल हैं या साइटमैप का साइज़ 50 एमबी से ज़्यादा है, तो आपको अपने साइटमैप को कई साइटमैप में बांटना होगा. आप चाहें, तो साइटमैप इंंडेक्स फ़ाइल बनाकर Google को सबमिट की जा सकती है. Google को एक से ज़्यादा साइटमैप और साइटमैप की इंडेक्स फ़ाइलें सबमिट की जा सकती हैं. अगर आपको Search Console में हर साइटमैप के लिए खोज की परफ़ॉर्मेंस ट्रैक करनी है, तो यह तरीका आपके लिए काम का हो सकता है.

साइटमैप फ़ाइल की एन्कोडिंग और जगह की जानकारी: साइटमैप फ़ाइल, UTF-8 एन्कोड में होनी चाहिए. साइटमैप को आपकी साइट पर कहीं भी होस्ट किया जा सकता है. हालांकि, Search Console का इस्तेमाल करके साइटमैप सबमिट न करने पर, साइटमैप सिर्फ़ पैरंट डायरेक्ट्री के डिसेंडेंट पर असर डालता है. इसलिए, साइट रूट पर पोस्ट किया गया साइटमैप, साइट की सभी फ़ाइलों पर असर डाल सकता है. हम साइट रूट पर ही साइटमैप पोस्ट करने का सुझाव देते हैं.

रेफ़र किए गए यूआरएल की प्रॉपर्टी: अपने साइटमैप में, पूरी तरह क्वालिफ़ाइड और पूरे यूआरएल का इस्तेमाल करें. Google आपके यूआरएल को ठीक वैसे ही क्रॉल करेगा जैसे उन्हें लिस्ट किया गया होगा. उदाहरण के लिए, अगर आपकी साइट https://www.example.com/ पर है, तो /mypage.html (कोई मिलता-जुलता यूआरएल) जैसे किसी यूआरएल को शामिल न करें. पूरे यूआरएल का ही इस्तेमाल करें: https://www.example.com/mypage.html.

अपने साइटमैप में उन यूआरएल को शामिल करें जिन्हें आपको Google के खोज के नतीजों में देखना है. आम तौर पर, Google अपने खोज के नतीजों में कैननिकल यूआरएल दिखाता है. साइटमैप का इस्तेमाल करके, यह चुना जा सकता है कि खोज के नतीजों में किन यूआरएल को दिखाना है. अगर आपके वेब पेज के मोबाइल और डेस्कटॉप वर्शन के यूआरएल अलग-अलग हैं, तो हमारा सुझाव है कि आप साइटमैप में सिर्फ़ एक वर्शन के बारे में बताएं. हालांकि, अगर साइटमैप में दोनों यूआरएल के बारे में बताना हो, तो दोनों यूआरएल की जानकारी दें और बताएं कि कौनसा यूआरएल डेस्कटॉप वर्शन का है और कौनसा मोबाइल वर्शन का.

सबसे सही तरीकों की पूरी सूची के लिए, साइटमैप प्रोटोकॉल देखें.

एक्सएमएल साइटमैप

एक्सएमएल साइटमैप, काम करने वाले साइटमैप के सभी फ़ॉर्मैट में से सबसे ज़्यादा खूबियों वाला साइटमैप है. Google के साथ काम करने वाले साइटमैप एक्सटेंशन का इस्तेमाल करके, इमेज, वीडियो, और खबरों वाले कॉन्टेंट के लिए अलग से जानकारी शामिल की जा सकती है. साथ ही, इसमें स्थानीय जगह के अनुसार बनाए गए पेज के वर्शन के लिए जानकारी शामिल की जा सकती है.

यहां एक बुनियादी एक्सएमएल साइटमैप दिया गया है. इसमें एक यूआरएल की जगह की जानकारी शामिल है:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.example.com/foo.html</loc>
    <lastmod>2022-06-04</lastmod>
  </url>
</urlset>

sitemaps.org पर, ज़्यादा कॉम्प्लेक्स साइटमैप के उदाहरण देखे जा सकते हैं. साथ ही, यहां आपको दस्तावेज़ में दी गई पूरी जानकारी भी मिलेगी.

एक्सएमएल साइटमैप के बारे में ज़्यादा जानकारी

  • सभी एक्सएमएल फ़ाइलों की तरह, एक्सएमएल साइटमैप में सभी टैग वैल्यू के लिए एंटिटी एस्केप की जानी चाहिए.
  • Google, <priority> और <changefreq> वैल्यू को नज़रअंदाज़ कर देता है.
  • Google, <lastmod> वैल्यू का इस्तेमाल तब ही करता है, जब वैल्यू लगातार एक जैसी और पुष्टि करने पर (उदाहरण के लिए, पेज में पिछली बार किए गए बदलाव की तुलना करके) सटीक पाई जाती है.

आरएसएस, एमआरएसएस, और ऐटम 1.0

अगर आपके ब्लॉग में आरएसएस या ऐटम फ़ीड शामिल है, तो फ़ीड के यूआरएल को साइटमैप के तौर पर सबमिट किया जा सकता है. ज़्यादातर ब्लॉग सॉफ़्टवेयर आपके लिए फ़ीड बना सकते हैं. हालांकि, इस बात का ध्यान रखें कि यह फ़ीड सिर्फ़ हाल ही के यूआरएल की जानकारी देता है.

आरएसएस, एमआरएसएस, और ऐटम 1.0 के बारे में ज़्यादा जानकारी

  • Google पर आरएसएस 2.0 और ऐटम 1.0 के फ़ीड इस्तेमाल किए जा सकते हैं.
  • Google को अपनी साइट पर मौजूद वीडियो की जानकारी देने के लिए, एमआरएसएस (मीडिया आरएसएस) फ़ीड का इस्तेमाल किया जा सकता है.
  • सभी एक्सएमएल फ़ाइलों की तरह, एक्सएमएल साइटमैप में सभी टैग वैल्यू के लिए एंटिटी एस्केप की जानी चाहिए.

टेक्स्ट साइटमैप

अगर आपके साइटमैप में सिर्फ़ वेब पेज के यूआरएल शामिल हैं, तो Google को एक ऐसी सामान्य टेक्स्ट फ़ाइल उपलब्ध कराई जा सकती है जिसमें हर लाइन में एक यूआरएल मौजूद हो. उदाहरण के लिए, अगर आपकी साइट पर दो पेज हैं, तो उन्हें इस तरह से साइटमैप में जोड़ा जा सकता है:

https://www.example.com/file1.html
https://www.example.com/file2.html

टेक्स्ट फ़ाइल वाले साइटमैप के बारे में ज़्यादा जानकारी

  • साइटमैप फ़ाइल में यूआरएल के अलावा कुछ और न डालें.
  • टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दिया जा सकता है, लेकिन ध्यान रखें कि उसका एक्सटेंशन .txt हो (जैसे, sitemap.txt).

साइटमैप बनाने का तरीका

साइटमैप बनाकर सर्च इंजन को यह बताया जाता है कि खोज के नतीजों में कौनसे यूआरएल को ज़्यादा दिखाया जाना है. ये कैननिकल यूआरएल होते हैं. अगर आपके पास एक ही कॉन्टेंट दिखाने वाले कई यूआरएल हैं, तो उनमें से अपनी पसंद का यूआरएल चुनें और उसे साइटमैप में शामिल करें. एक ही कॉन्टेंट पर ले जाने वाले सभी यूआरएल को साइटमैप में शामिल न करें.

यह तय कर लेने के बाद कि साइटमैप में कौनसे यूआरएल को शामिल करने हैं, अपनी साइट के लिए साइटमैप बनाएं. इसके लिए, अपनी साइट की बनावट और साइज़ के आधार पर, यहां बताए गए तरीकों में से किसी एक को चुनें:

कॉन्टेंट मैनेजमेंट सिस्टम को साइटमैप जनरेट करने देना

अगर WordPress, Wix या Blogger जैसे किसी कॉन्टेंट मैनेजमेंट सिस्टम का इस्तेमाल किया जा रहा है, तो हो सकता है कि आपके कॉन्टेंट मैनेजमेंट सिस्टम ने पहले से ही, सर्च इंजन को साइटमैप उपलब्ध करा दिया हो. इस बारे में जानकारी खोजें कि कॉन्टेंट मैनेजमेंट सिस्टम, साइटमैप कैसे जनरेट करता है. इसके अलावा, यह जानकारी भी देखें कि अगर आपका कॉन्टेंट मैनेजमेंट सिस्टम अपने-आप साइटमैप जनरेट नहीं करता है, तो साइटमैप बनाने का तरीका क्या है. उदाहरण के लिए, Wix के मामले में, "Wix साइटमैप" खोजें या Blogger के मामले में, "Blogger आरएसएस" खोजें.

मैन्युअल तरीके से साइटमैप बनाना

जिन साइटमैप में कुछ दर्ज़न से भी कम यूआरएल हैं उनके लिए, मैन्युअल तरीके से साइटमैप बनाया जा सकता है. मैन्युअल तरीके से साइटमैप बनाने के लिए, Windows Notepad या Nano (Linux, MacOS), जैसा कोई टेक्स्ट एडिटर खोलें. साथ ही, साइटमैप फ़ॉर्मैट सेक्शन में बताए गए सिंटैक्स के दिशा-निर्देशों का पालन करें. टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दिया जा सकता है, लेकिन देख लें कि यूआरएल में उन वर्णों का इस्तेमाल किया जा सकता हो जिनकी अनुमति हो.

बड़े साइटमैप भी मैन्युअल तरीके से बनाए जा सकते हैं. हालांकि, इस प्रोसेस में बहुत मेहनत लगती है और इसे लंबे समय तक बनाए रखना मुश्किल है.

टूल की मदद से ऑटोमैटिक तरीके से साइटमैप जनरेट करना

जिन साइटमैप में कुछ दर्ज़न से ज़्यादा यूआरएल हैं उनके लिए, आपको ऑटोमैटिक तरीके से साइटमैप जनरेट करना होगा. ऐसे कई टूल हैं जिनका इस्तेमाल करके, साइटमैप जनरेट किया जा सकता है. हालांकि, साइटमैप बनाने का सबसे अच्छा तरीका यह है कि आपकी वेबसाइट का सॉफ़्टवेयर इसे जनरेट करे. उदाहरण के लिए, वेबसाइट के डेटाबेस से अपनी साइट के यूआरएल निकालकर, इन्हें वेब सर्वर पर, अपनी स्क्रीन या ओरिजनल फ़ाइल में एक्सपोर्ट किया जा सकता है. इस तरीके से साइटमैप बनाने के बारे में अपने डेवलपर या सर्वर मैनेजर से बात करें. अगर आपको कोड को लेकर मदद चाहिए, तो तीसरे पक्ष के साइटमैप जनरेटर के हमारे पुराने और बिना रखरखाव वाले कलेक्शन को देखें.

आपको साइटमैप में यूआरएल के क्रम को लेकर चिंता करने की ज़रूरत नहीं है. Google को इससे कोई फ़र्क़ नहीं पड़ता. साइटमैप के लिए साइज़ की ज़रूरी शर्तों को ध्यान में रखें. अगर साइटमैप का साइज़ बहुत बड़ा हो जाता है, तो उसे छोटे-छोटे साइटमैप में बांटें. बड़े साइटमैप मैनेज करने के बारे में ज़्यादा जानें.

Google को अपना साइटमैप सबमिट करना

ध्यान रखें कि साइटमैप को सबमिट करना सिर्फ़ एक संकेत है. इससे, यह पक्का नहीं होता कि Google साइटमैप को डाउनलोड करेगा या साइट पर यूआरएल को क्रॉल करने के लिए साइटमैप का इस्तेमाल करेगा. आप Google को अपना साइटमैप उपलब्ध करा सकें, इसके लिए कुछ तरीके यहां दिए गए हैं:

  • साइटमैप की रिपोर्ट का इस्तेमाल करके, Search Console में साइटमैप सबमिट करें. इससे आपको यह देखने में मदद मिलेगी कि Googlebot ने साइटमैप को कब ऐक्सेस किया. साथ ही, आपको प्रोसेस को लेकर संभावित गड़बड़ियों की जानकारी भी मिलेगी.
  • प्रोग्राम के हिसाब से, अपने-आप होने वाली प्रोसेस के ज़रिए साइटमैप सबमिट करने के लिए, Search Console API का इस्तेमाल करें.
  • पिंग करने वाले टूल का इस्तेमाल करें. अपने ब्राउज़र या कमांड लाइन में इस पते पर GET अनुरोध भेजें. इस अनुरोध में साइटमैप का पूरा यूआरएल शामिल करें. ध्यान रखें कि Googlebot, साइटमैप की फ़ाइल को ऐक्सेस कर सके:
    https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP

    उदाहरण:

    https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
  • यह जानकारी देने के लिए कि आपके साइटमैप पर कैसे पहुंचा जा सकता है, नीचे दी गई लाइन को अपनी robots.txt फ़ाइल में कहीं भी शामिल करें. अगली बार आपकी robots.txt फ़ाइल को क्रॉल करते समय हम इसका इस्तेमाल करेंगे:
    Sitemap: https://example.com/my_sitemap.xml
  • ऐटम या आरएसएस का इस्तेमाल करने पर, WebSub का इस्तेमाल करके, अपने बदलावों को Google जैसे सर्च इंजन पर ब्रॉडकास्ट किया जा सकता है.

एक से ज़्यादा साइटों के लिए साइटमैप सबमिट करने का तरीका

अगर आपकी एक से ज़्यादा वेबसाइटें हैं, तो सबमिट करने की प्रोसेस को आसान बनाया जा सकता है. इसके लिए, आपको एक या एक से ज़्यादा ऐसे साइटमैप बनाने होंगे जिनमें आपकी उन सभी साइटों के यूआरएल हों जिनकी पुष्टि हो चुकी है. साथ ही, साइटमैप को एक ही जगह पर सेव करना होगा. इनका इस्तेमाल किया जा सकता है:

  • कोई ऐसा साइटमैप जिसमें कई वेबसाइटों के यूआरएल शामिल हों. ये यूआरएल अलग-अलग डोमेन की वेबसाइटों के भी हो सकते हैं. उदाहरण के लिए, https://host1.example.com/sitemap.xml पर मौजूद साइटमैप में ये यूआरएल शामिल हो सकते हैं.
    • https://host1.example.com
    • https://host2.example.com
    • https://host3.example.com
    • https://host1.example1.com
    • https://host1.example.ch
  • ऐसे अलग-अलग साइटमैप (हर साइट के लिए एक) जो एक ही जगह पर मौजूद हों.
    • https://host1.example.com/host1-example-sitemap.xml
    • https://host1.example.com/host2-example-sitemap.xml
    • https://host1.example.com/host3-example-sitemap.xml
    • https://host1.example.com/host1-example1-sitemap.xml
    • https://host1.example.com/host1-example-ch-sitemap.xml

एक ही जगह पर होस्ट होने वाले क्रॉस-साइट साइटमैप सबमिट करने के लिए, Search Console या robots.txt का इस्तेमाल करें.

Search Console के साथ साइटमैप का क्रॉस-सबमिशन

  1. देखें कि आपने उन सभी साइटों के मालिकाना हक की पुष्टि कर ली है जिन्हें आपको साइटमैप में जोड़ना है.
  2. ऐसा साइटमैप बनाएं जिसमें उन सभी साइटों के यूआरएल शामिल हों जिन्हें आपको शामिल करना है. इसके अलावा, एक से ज़्यादा साइटमैप भी बनाए जा सकते हैं. आपके पास साइटमैप इंडेक्स फ़ाइल में साइटमैप जोड़ने का विकल्प होता है. ऐसा तब करें, जब आपको उस साइटमैप इंडेक्स का इस्तेमाल करना है.
  3. Google Search Console का इस्तेमाल करके, अपने साइटमैप या साइटमैप की इंडेक्स फ़ाइल सबमिट करें.

robots.txt की मदद से साइटमैप सबमिट करना

  1. हर साइट के लिए एक या इससे ज़्यादा साइटमैप बनाएं. हर साइटमैप फ़ाइल के लिए, देखें कि एक ही साइट के यूआरएल शामिल किए गए हों.
  2. सभी साइटमैप को उस साइट पर अपलोड करें जिस पर आपका कंट्रोल है. उदाहरण के लिए, https://sitemaps.example.com.
  3. हर साइट के लिए, देखें कि robots.txt फ़ाइल उस साइट के साइटमैप की जानकारी देती हो. उदाहरण के लिए, अगर आपने https://example.com/ के लिए साइटमैप बनाया है और आपको उसे https://sitemaps.example.com/sitemap-example-com.xml पर होस्ट करना है, तो robots.txt फ़ाइल में https://example.com/robots.txt के साथ उस साइटमैप की जानकारी दें.
    # robots.txt file of https://example.com/
    sitemap: https://sitemaps.example.com/sitemap-example-com.xml

साइटमैप से जुड़ी समस्या हल करना

Google Search Console की मदद से साइटमैप से जुड़ी समस्या हल की जा सकती है. सहायता पाने के लिए, साइटमैप से जुड़ी समस्या हल करने की गाइड देखें.