यूआरएल का स्ट्रक्चर आसान रखना
किसी साइट के यूआरएल का स्ट्रक्चर जितना हो सके उतना आसान होना चाहिए. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें.
जहां भी हो सके, अपने यूआरएल में लंबे आईडी नंबर के बजाय, पढ़ने में आसान शब्दों का इस्तेमाल करें.
इसका सुझाव दिया जाता है: यूआरएल में आसान और जानकारी देने वाले शब्दों का इस्तेमाल करें:
https://en.wikipedia.org/wiki/Aviation
इसका सुझाव दिया जाता है: अगर हो सके, तो यूआरएल में स्थानीय भाषा के शब्दों का इस्तेमाल करना.
https://www.example.com/lebensmittel/pfefferminz
इसका सुझाव दिया जाता है: ज़रूरत के हिसाब से, UTF-8 एन्कोडिंग का इस्तेमाल करना. जैसे, इस उदाहरण में, यूआरएल में मौजूद ऐरेबिक वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
इस उदाहरण में, यूआरएल में मौजूद चाइनीज़ वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
इस उदाहरण में, यूआरएल में मौजूद ऊमलाउट वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://www.example.com/gem%C3%BCse
इस उदाहरण में, यूआरएल में मौजूद इमोजी के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://example.com/%F0%9F%A6%99%E2%9C%A8
इसका सुझाव नहीं दिया जाता: यूआरएल में, बिना ASCII वाले वर्णों का इस्तेमाल करना:
https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨
इसका सुझाव नहीं दिया जाता: यूआरएल में, पढ़े नहीं जा सकने वाले, लंबे आईडी नंबर का इस्तेमाल करना:
https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
अगर आपकी साइट कई इलाकों में उपलब्ध है, तो ऐसे यूआरएल का इस्तेमाल करें जिनकी मदद से, आपकी साइट अलग-अलग इलाकों के उपयोगकर्ताओंं को टारगेट कर सके. यूआरएल को स्ट्रक्चर करने से जुड़े और उदाहरण देखने के लिए, अलग-अलग इलाकों के हिसाब से बनाए गए यूआरएल इस्तेमाल करना लेख देखें.
इसका सुझाव दिया जाता है: देश के हिसाब से डोमेन इस्तेमाल करें:
https://example.de
इसका सुझाव दिया जाता है: देश के हिसाब से, gTLD वाली सबडायरेक्ट्री इस्तेमाल करना:
https://example.com/de/
अपने यूआरएल में शब्दों को अलग-अलग करने के लिए, हाइफ़न का इस्तेमाल करें. इससे लोग और सर्च इंजन, यूआरएल में मौजूद कीवर्ड ज़्यादा आसानी से समझ पाते हैं. हमारा सुझाव है कि यूआरएल में, अंडरस्कोर (_
) के बजाय हाइफ़न (-
) का इस्तेमाल करें.
इसका सुझाव दिया जाता है: हाइफ़न (-
) का इस्तेमाल करना:
https://www.example.com/summer-clothing/filter?color-profile=dark-grey
इसका सुझाव नहीं दिया जाता: अंडरस्कोर (_
) का इस्तेमाल करना:
https://www.example.com/summer_clothing/filter?color_profile=dark_grey
इसका सुझाव नहीं दिया जाता: यूआरएल में मौजूद कीवर्ड को एक साथ लिखना:
https://www.example.com/greendress
ज़्यादा मुश्किल स्ट्रक्चर वाले यूआरएल से क्रॉलर को परेशानी हो सकती है, क्योंकि ये यूआरएल आपकी साइट के लिए ऐसे कई यूआरएल बना देते हैं जो एक जैसा या मिलता-जुलता कॉन्टेंट दिखाते हैं. इनमें खास तौर पर ऐसे यूआरएल शामिल हैं जिनमें एक से ज़्यादा पैरामीटर इस्तेमाल किए जाते हैं. इस वजह से हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ का इस्तेमाल करे. इसके अलावा, आपकी साइट के पूरे कॉन्टेंट को पूरी तरह इंडेक्स न कर पाए.
इस समस्या की सामान्य वजहें
बेवजह बहुत सारे यूआरएल बनने की कई वजहें हो सकती हैं. इनमें से आम वजह यहां दी गई हैं:
- एक आइटम सेट के लिए कई फ़िल्टर इस्तेमाल करना. कई साइटें, एक ही आइटम सेट या
खोज के नतीजों को अलग-अलग तरीके से दिखाती हैं. कई मामलों में उपयोगकर्ता, दिए गए पैरामीटर के हिसाब
से आइटम सेट के लिए फ़िल्टर का इस्तेमाल भी कर सकते हैं. फ़िल्टर के लिए, पहले से तय कुछ विकल्प भी दिए गए होते हैं (उदाहरण के लिए, ऐसे होटल दिखाओ जो समुद्र के किनारे हैं).
इसके अलावा, जब कई फ़िल्टर एक साथ इस्तेमाल किए जाते हैं (उदाहरण के लिए, ऐसे होटल जो समुद्र के किनारे हैं और उनमें फ़िटनेस सेंटर भी है), तो
साइटों में यूआरएल की संख्या (डेटा को देखे जाने की संख्या) अचानक बढ़ जाती है. थोड़े-बहुत अंतर की वजह से
होटल के लिए अलग-अलग सूचियां बनाना ज़रूरी नहीं है, क्योंकि Googlebot सिर्फ़ कुछ ही सूचियां देखता है और
वह उनसे हर होटल के पेज पर पहुंच सकता है. उदाहरण के लिए:
- "किफ़ायती दरों" पर होटल:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
- समुद्र के किनारे "किफ़ायती दरों" पर होटल:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
- समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर के साथ होटल:
:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
- "किफ़ायती दरों" पर होटल:
- डाइनैमिक तरीके से दस्तावेज़ बनाना. इससे काउंटर, टाइमस्टैंप या विज्ञापनों की वजह से थोड़े-बहुत बदलाव हो सकते हैं.
- यूआरएल में समस्या पैदा करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी बड़ी संख्या में डुप्लीकेट और बहुत सारे यूआरएल बना सकते हैं.
-
पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम
से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. जैसे:
https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- यूआरएल में ऐसे पैरामीटर का होना जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. जैसे:
https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- कैलेंडर से जुड़ी समस्याएं. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों की सीमा तय किए बिना,
पिछली और आने वाली तारीखों के लिए लिंक बना सकता है. जैसे:
https://www.example.com/calendar.php?d=13&m=8&y=2011
- मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से यूआरएल में असीमित
खाली जगह बन सकती है. आम तौर पर, यह समस्या पाथ एलिमेंट को बार-बार दोहराने की वजह से आती है. जैसे:
https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
इस समस्या को ठीक करना
हमारा सुझाव है कि यूआरएल स्ट्रक्चर से जुड़ी समस्याओं से बचने के लिए, आप यह तरीका अपनाएं:
- ऐसे यूआरएल जिनमें समस्या आ रही है, उनमें robots.txt फ़ाइल का इस्तेमाल करें, ताकि Googlebot उन्हें ऐक्सेस न कर सके. खास तौर पर, डाइनैमिक यूआरएल ब्लॉक करें. उदाहरण के लिए, खोज के नतीजे तैयार करने वाले यूआरएल या असीमित खाली जगह बनाने वाले यूआरएल, जैसे कि कैलेंडर. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करें. ऐसा करके, आसानी से बहुत सारे यूआरएल ब्लॉक किए जा सकते हैं.
- जहां भी हो सके, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इनके बजाय, कुकी का इस्तेमाल करें.
- जहां भी हो सके, गै़र-ज़रूरी पैरामीटर को काट-छांट कर यूआरएल को छोटा करें.
- अगर आपकी साइट में ऐसा कैलेंडर है जिसमें शुरू और खत्म होने की तारीख मौजूद नहीं है, तो आने वाले समय के लिए डाइनैमिक तरीके से बनाए गए कैलेंडर पेजों के लिंक में एक
nofollow
एट्रिब्यूट जोड़ें. - अपनी साइट पर काम न करने वाले मिलते-जुलते लिंक देखें.