Google के लिए यूआरएल स्ट्रक्चर डिज़ाइन करने के सबसे सही तरीके

Google पर, आरएफ़सी 3986 के मुताबिक यूआरएल का इस्तेमाल किया जा सकता है. इस स्टैंडर्ड के तहत रिज़र्व किए गए वर्णों को पर्सेंट कोड में बदला जाना चाहिए. रिज़र्व नहीं किए गए ASCII वर्णों को, बिना कोड में बदले गए फ़ॉर्मैट में छोड़ा जा सकता है. इसके अलावा, गैर-ASCII रेंज के वर्णों को UTF-8 कोड में बदला जाना चाहिए.

जहां भी हो सके, अपने यूआरएल में लंबे आईडी नंबर के बजाय, पढ़ने में आसान शब्दों का इस्तेमाल करें.

इसका सुझाव दिया जाता है: यूआरएल में आसान और जानकारी देने वाले शब्दों का इस्तेमाल करें:

https://en.wikipedia.org/wiki/Aviation

इसका सुझाव दिया जाता है: अगर हो सके, तो यूआरएल में स्थानीय भाषा के शब्दों का इस्तेमाल करना.

https://www.example.com/lebensmittel/pfefferminz

इसका सुझाव दिया जाता है: ज़रूरत के हिसाब से, UTF-8 एन्कोडिंग का इस्तेमाल करना. जैसे, इस उदाहरण में, यूआरएल में मौजूद ऐरेबिक वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

इस उदाहरण में, यूआरएल में मौजूद चाइनीज़ वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

इस उदाहरण में, यूआरएल में मौजूद ऊमलाउट वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://www.example.com/gem%C3%BCse

इस उदाहरण में, यूआरएल में मौजूद इमोजी के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://example.com/%F0%9F%A6%99%E2%9C%A8

इसका सुझाव नहीं दिया जाता: यूआरएल में, बिना ASCII वाले वर्णों का इस्तेमाल करना:

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

इसका सुझाव नहीं दिया जाता: यूआरएल में, पढ़े नहीं जा सकने वाले, लंबे आईडी नंबर का इस्तेमाल करना:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

अगर आपकी साइट कई इलाकों में उपलब्ध है, तो ऐसे यूआरएल का इस्तेमाल करें जिनकी मदद से, आपकी साइट अलग-अलग इलाकों के उपयोगकर्ताओंं को टारगेट कर सके. यूआरएल को स्ट्रक्चर करने से जुड़े और उदाहरण देखने के लिए, अलग-अलग इलाकों के हिसाब से बनाए गए यूआरएल इस्तेमाल करना लेख देखें.

इसका सुझाव दिया जाता है: देश के हिसाब से डोमेन इस्तेमाल करें:

https://example.de

इसका सुझाव दिया जाता है: देश के हिसाब से, gTLD वाली सबडायरेक्ट्री इस्तेमाल करना:

https://example.com/de/

अपने यूआरएल में शब्दों को अलग-अलग करने के लिए, हाइफ़न का इस्तेमाल करें. इससे लोग और सर्च इंजन, यूआरएल में मौजूद कीवर्ड ज़्यादा आसानी से समझ पाते हैं. हमारा सुझाव है कि आप अपने यूआरएल में, अंडरस्कोर (_) के बजाय, हाइफ़न (-) का इस्तेमाल करें.

इसका सुझाव दिया जाता है: हाइफ़न (-) का इस्तेमाल करना:

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

इसका सुझाव नहीं दिया जाता: अंडरस्कोर (_) का इस्तेमाल करना:

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

इसका सुझाव नहीं दिया जाता: यूआरएल में मौजूद कीवर्ड को एक साथ लिखना:

https://www.example.com/greendress

यूआरएल से जुड़ी सामान्य समस्याएं

ज़्यादा मुश्किल स्ट्रक्चर वाले यूआरएल से क्रॉलर को परेशानी हो सकती है, क्योंकि ये यूआरएल आपकी साइट के लिए ऐसे कई यूआरएल बना देते हैं जो एक जैसा या मिलता-जुलता कॉन्टेंट ही दिखाते हैं. इनमें, खास तौर पर ऐसे यूआरएल शामिल हैं जिनमें एक से ज़्यादा पैरामीटर का इस्तेमाल किया जाता है. इस वजह से हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ का इस्तेमाल करे. इसके अलावा, आपकी साइट के पूरे कॉन्टेंट को पूरी तरह इंडेक्स न कर पाए.

बेवजह बहुत सारे यूआरएल बनने की कई वजहें हो सकती हैं. इनमें से आम वजह यहां दी गई हैं:

  • एक आइटम सेट के लिए कई फ़िल्टर इस्तेमाल करना. कई साइटें, एक ही आइटम सेट या खोज के नतीजों को अलग-अलग तरीके से दिखाती हैं. कई मामलों में उपयोगकर्ता, दिए गए पैरामीटर के हिसाब से आइटम सेट के लिए फ़िल्टर का इस्तेमाल भी कर सकते हैं. फ़िल्टर के लिए, पहले से तय कुछ विकल्प भी दिए गए होते हैं (उदाहरण के लिए, ऐसे होटल दिखाओ जो समुद्र के किनारे हैं). इसके अलावा, जब कई फ़िल्टर एक साथ इस्तेमाल किए जाते हैं (उदाहरण के लिए, ऐसे होटल जो समुद्र के किनारे हैं और उनमें फ़िटनेस सेंटर भी है), तो साइटों में यूआरएल की संख्या (डेटा को देखे जाने की संख्या) अचानक बढ़ जाती है. थोड़े-बहुत अंतर की वजह से होटल के लिए अलग-अलग सूचियां बनाना ज़रूरी नहीं है, क्योंकि Googlebot सिर्फ़ कुछ ही सूचियां देखता है और वह उनसे हर होटल के पेज पर पहुंच सकता है. उदाहरण के लिए:
    • "किफ़ायती दरों" पर होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • समुद्र के किनारे "किफ़ायती दरों" पर होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर के साथ होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • डाइनैमिक तरीके से दस्तावेज़ बनाना. इससे काउंटर, टाइमस्टैंप या विज्ञापनों की वजह से थोड़े-बहुत बदलाव हो सकते हैं.
  • यूआरएल में समस्या पैदा करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी बड़ी संख्या में डुप्लीकेट और बहुत सारे यूआरएल बना सकते हैं.
  • पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. जैसे:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • यूआरएल में ऐसे पैरामीटर का होना जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. उदाहरण के लिए:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • कैलेंडर से जुड़ी समस्याएं. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों की सीमा तय किए बिना, पिछली और आने वाली तारीखों के लिए लिंक बना सकता है. उदाहरण के लिए:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • किसी विषय से मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से इंफ़ाइनाइट स्पेस बन सकता है. यह समस्या पाथ एलिमेंट को बार-बार दोहराने की वजह से आती है. उदाहरण के लिए:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

यूआरएल से जुड़ी समस्याओं को ठीक करना

यूआरएल स्ट्रक्चर से जुड़ी संभावित समस्याओं से बचने के लिए, हम आपको ये तरीके अपनाने का सुझाव देते हैं:

  • यूआरएल का आसान स्ट्रक्चर बनाएं. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें.
  • ऐसे यूआरएल जिनमें समस्या आ रही है, उनमें robots.txt फ़ाइल का इस्तेमाल करें, ताकि Googlebot उन्हें ऐक्सेस न कर सके. खास तौर पर, डाइनैमिक यूआरएल ब्लॉक करें. उदाहरण के लिए, खोज के नतीजे तैयार करने वाले यूआरएल या असीमित खाली जगह बनाने वाले यूआरएल, जैसे कि कैलेंडर. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करें. ऐसा करके, आसानी से बहुत सारे यूआरएल ब्लॉक किए जा सकते हैं.
  • जहां भी हो सके, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इनके बजाय, कुकी का इस्तेमाल करें.
  • अगर वेब सर्वर किसी यूआरएल में मौजूद बड़े और छोटे अक्षरों वाले टेक्स्ट को एक ही तरीके से देखता है, तो पूरे टेक्स्ट को एक ही तरह के अक्षरों (बड़े या छोटे) में बदलें. इससे, Google के लिए यह तय करना आसान हो जाता है कि यूआरएल उपयोगकर्ता को एक ही पेज पर ले जाते हैं.
  • जहां भी हो सके, गै़र-ज़रूरी पैरामीटर की काट-छांट करके यूआरएल को छोटा करें.
  • अगर आपकी साइट में ऐसा कैलेंडर है जिसमें शुरू और खत्म होने की तारीख मौजूद नहीं है, तो आने वाले समय के लिए डाइनैमिक तरीके से बनाए गए कैलेंडर पेजों के लिंक में एक nofollow एट्रिब्यूट जोड़ें.
  • अपनी साइट पर काम न करने वाले मिलते-जुलते लिंक देखें.