अपने डुप्लीकेट पेजों के लिए सही कैननिकल यूआरएल चुनने में, Google की मदद करें

अगर आपकी साइट पर कोई ऐसा पेज है जिसके कई यूआरएल हैं या एक जैसे कॉन्टेंट वाले कई पेज हैं, तो Google उन्हें एक ही पेज के डुप्लीकेट वर्शन मानता है. जैसे, कोई ऐसा पेज जिसके मोबाइल और डेस्कटॉप, दोनों वर्शन हैं. Google उस पेज के किसी एक यूआरएल को कैननिकल वर्शन के तौर पर चुनकर, उसे क्रॉल करेगा. बाकी सभी यूआरएल काे डुप्लीकेट यूआरएल मानकर, उन्हें कभी-कभी ही क्रॉल करेगा.

Google को साफ़ ताैर पर यह नहीं बताने पर कि कौनसे यूआरएल को कैननिकल माना जाए, तो Google अपने हिसाब से एक कैननिकल यूआरएल चुन लेगा या दाेनाें ही यूआरएल काे बराबर मान लेगा. इससे हो सकता है कि आपके पेज, खोज नतीजों में सही से न दिखाए जाएं. इस बारे में ज़्यादा जानकारी, नीचे दिए गए सेक्शन कैननिकल यूआरएल क्यों चुनना चाहिए में माैजूद है.

Google का, कैननिकल यूआरएल को चुनने और इंडेक्स करने का तरीका

किसी साइट को इंडेक्स करते समय, Google उस साइट के हर पेज के मुख्य कॉन्टेंट का पता लगाने की कोशिश करता है. अगर Google को एक ही साइट पर एक जैसे कई पेज मिलते हैं, तो वह उस पेज को चुनता है जो उसे सबसे ज़्यादा जानकारी देने वाला और काम का लगता है. इस पेज को कैननिकल पेज के तौर पर मार्क किया जाता है. आपकी साइट के कैननिकल पेज को नियमित तौर पर क्रॉल किया जाएगा, लेकिन डुप्लीकेट पेज कभी-कभी ही क्रॉल किए जाएंगे. इससे, आपकी साइट पर क्रॉल करने से जुड़े लोड को कम करने में मदद मिलती है.

Google कई चीज़ों (या सिग्नल) को ध्यान में रखकर, कैननिकल पेज चुनता है. उदाहरण के लिए, पेज की क्वालिटी, साइटमैप में यूआरएल की मौजूदगी, पेज के लिए किस प्रोटोकॉल का इस्तेमाल किया गया है - एचटीटीपी या फिर एचटीटीपीएस, और पेज पर rel=canonical लेबल की मौजूदगी. इन तरीकों से Google को अपनी पसंद बताएं. इसके बाद भी, Google किसी दूसरे पेज को कैननिकल पेज के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं.

किसी पेज के अलग-अलग भाषाओं वाले वर्शन तभी डुप्लीकेट माने जाते हैं, जब पेज का मुख्य कॉन्टेंट एक ही भाषा में हो. इसका मतलब यह है कि पेजों के सिर्फ़ हेडर, फ़ुटर या दूसरे गै़र-ज़रूरी टेक्स्ट का तो अनुवाद किया गया हो, लेकिन मुख्य लेख एक ही भाषा में दिया गया हो.

Google, कॉन्टेंट और क्वॉलिटी का आकलन करने के लिए कैननिकल पेजों का इस्तेमाल करता है. Google Search के नतीजों में आम तौर पर कैननिकल पेज को ही दिखाया जाता है. हालांकि, अगर किसी उपयोगकर्ता की क्वेरी के हिसाब से कोई डुप्लीकेट पेज बेहतर हो, तो कैननिकल पेज की जगह वह पेज दिखाया जाता है. उदाहरण के लिए, अगर उपयोगकर्ता किसी मोबाइल डिवाइस पर कुछ खोज रहा है, तो हो सकता है कि खोज के नतीजों में उसे पेज का मोबाइल वर्शन ही दिखाया जाए. भले ही, डेस्कटॉप वर्शन को कैननिकल पेज के तौर पर सेट किया गया हो.

मिलते-जुलते या डुप्लीकेट पेज रखने की वजहें

आपकी साइट पर एक ही पेज के अलग-अलग यूआरएल हो सकते हैं. साथ ही, अलग-अलग यूआरएल पर डुप्लीकेट या मिलते-जुलते पेज भी हो सकते हैं. इसकी सबसे आम वजहें यहां दी गई हैं:

  • कई तरह के डिवाइस पर काम करने के लिए:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • अगर सर्च पैरामीटर या सेशन आईडी जैसी चीज़ों के लिए, डाइनैमिक यूआरएल चालू करना हो:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • अगर एक ही पोस्ट को कई सेक्शन में डालने पर, आपका ब्लॉग सिस्टम अपने-आप कई यूआरएल सेव करता हो.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • अगर आपका सर्वर, www/non-www http/https और प्रोटोकॉल पोर्ट वैरिएंट के लिए, एक जैसा कॉन्टेंट दिखाने के लिए कॉन्फ़िगर किया गया हो:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    http://example.com:80/green-dresses
    https://example.com:443/green-dresses
  • अगर आपने किसी ब्लॉग पर ऐसा कॉन्टेंट दिया हो जो दूसरी साइटों पर सिंडिकेशन के लिए हो और उस कॉन्टेंट को उन डोमेन पर पूरा या थोड़ा-बहुत दिखाया जाता हो:
    https://news.example.com/green-dresses-for-every-day-155672.html (सिंडिकेटेड पोस्ट) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (ओरिजनल पोस्ट)

कैननिकल यूआरएल चुनने की वजहें

आपको डुप्लीकेट/एक जैसे पेजों के सेट में से किसी पेज को खास तौर से कैननिकल पेज के तौर पर क्यों चुनना चाहिए, इसकी कई वजहें हो सकती हैं:

  • यह बताने के लिए कि आपको लोगों को, खोज के नतीजों में कौनसा यूआरएल दिखाना है. हो सकता है आप चाहें कि लोग आपके हरे रंग के कपड़ों के प्रॉडक्ट पेज पर, https://example.com/dresses/cocktail?gclid=ABCD के बजाय https://www.example.com/dresses/green/greendress.html से पहुंचें.
  • एक जैसे या डुप्लीकेट पेजों के लिए लिंक सिग्नलों को एक करने के लिए. इससे, सर्च इंजन को अलग-अलग यूआरएल के लिए मौजूद जानकारी (जैसे, उनके लिंक) को एक पसंदीदा (कैननिकल) यूआरएल में, एक साथ शामिल करने में मदद मिलती है. इसका मतलब है कि http://example.com/dresses/cocktail?gclid=ABCD के लिए दूसरी साइटों के लिंक, https://www.example.com/dresses/green/greendress.html के लिंक के साथ मिलकर एक हो जाते हैं.
  • सिर्फ़ एक प्रॉडक्ट/विषय की ट्रैकिंग मेट्रिक को आसान बनाने के लिए. अलग-अलग तरह के यूआरएल होने की वजह से, किसी खास कॉन्टेंट के लिए एक ऐसा मेट्रिक पाना मुश्किल होता है जिसमें सभी यूआरएल की जानकारी शामिल हो.
  • सिंडिकेटेड कॉन्टेंट को मैनेज करने के लिए. अगर आपने अन्य डोमेन पर पब्लिश करने के लिए अपने कॉन्टेंट का डुप्लीकेट बनाने का विकल्प चुना है, तो इसका मतलब है कि आपको पसंदीदा (कैननिकल) यूआरएल, खोज के नतीजों में दिखाना है.
  • डुप्लीकेट पेजों पर क्रॉलिंग में समय गंवाने से बचने के लिए. आप चाहेंगे कि Googlebot आपकी साइट का ज़्यादा से ज़्यादा कॉन्टेंट क्रॉल कर ले. इसलिए, बेहतर होगा कि वह एक ही पेज के डेस्कटॉप और मोबाइल वर्शन को क्रॉल करने के बजाय, आपकी साइट के नए (या अपडेट किए गए) पेजों को क्रॉल करे.

जानना कि Google किस पेज को कैननिकल मानता है

यूआरएल जांचने वाले टूल का इस्तेमाल करके जानें कि Google किस पेज को कैननिकल मानता है.

कैननिकल पेज तय करना

अगर मिलते-जुलते पेजों या डुप्लीकेट यूआरएल के लिए कैननिकल यूआरएल तय करना हो, तो यहां दिए गए तरीकों में से किसी एक का इस्तेमाल करें. सामान्य दिशा-निर्देशों का पालन ज़रूर करें.

तरीका और ब्यौरा
rel=canonical <link> टैग

कैननिकल पेज पर ले जाने वाले सभी डुप्लीकेट पेजों के लिए, कोड में एक <link> टैग जोड़ें.

फ़ायदे:
  • अनगिनत डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • इससे, पेज का साइज़ बढ़ सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
  • सिर्फ़ एचटीएमएल पेजों के लिए काम करता है, PDF जैसी फ़ाइलों के लिए नहीं. ऐसे मामलों में, आप rel=canonical एचटीटीपी हेडर इस्तेमाल कर सकते हैं.
rel=canonical एचटीटीपी हेडर

आपका पेज खोजे जाने पर एक rel=canonical हेडर भेजें.

फ़ायदे:

  • इससे, पेज का साइज़ नहीं बढ़ता है.
  • अनगिनत डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
साइटमैप

साइटमैप में अपने कैननिकल पेजों के बारे में जानकारी दें.

फ़ायदे:

  • खास तौर पर, बड़ी साइटों पर काम करना आसान होता है.

नुकसान:

  • Google को अब भी ऐसे किसी कैननिकल पेज से जुड़ा डुप्लीकेट पेज तय करना होगा जिसके बारे में आपने साइटमैप में बताया है.
  • Google के लिए, rel=canonical मैपिंग तकनीक के मुकाबले कमज़ोर सिग्नल.
301 रीडायरेक्ट 301 रीडायरेक्ट का इस्तेमाल Googlebot को यह बताने के लिए करें कि रीडायरेक्ट करने वाला यूआरएल, दिए गए यूआरएल के मुकाबले एक बेहतर वर्शन है. इसका इस्तेमाल सिर्फ़ तब करें, जब किसी डुप्लीकेट पेज को क्रॉल किए जाने से रोकना हो.
एएमपी के वैरिएंट अगर कोई वैरिएंट एक एएमपी पेज है, तो कैननिकल पेज और एएमपी फ़ॉर्मैट के बारे में बताने के लिए, आपको एएमपी दिशा-निर्देशों का पालन करना होगा.

सामान्य दिशा-निर्देश

यूआरएल के कैननिकल होने की जांच करने के सभी तरीकों के लिए, इन सामान्य दिशा-निर्देशों का पालन करें:

  • यूआरएल के कैननिकल होने की जांच करने के लिए, robots.txt फ़ाइल का इस्तेमाल न करें.
  • यूआरएल के कैननिकल होने की जांच करने के लिए, यूआरएल हटाने वाले टूल का इस्तेमाल न करें. ऐसा करने से यूआरएल के सभी वर्शन, Search के नतीजों से हटा दिए जाते हैं.
  • यूआरएल के कैननिकल होने की जांच करने की एक जैसी या अलग-अलग तकनीकों का इस्तेमाल करके, एक ही पेज के लिए अलग-अलग यूआरएल को कैननिकल के तौर पर तय न करें (उदाहरण के लिए, ऐसा न हो कि किसी पेज के लिए साइटमैप में एक यूआरएल को और rel="canonical" का इस्तेमाल करके किसी दूसरे यूआरएल को कैननिकल के तौर पर तय कर दिया जाए).
  • किसी कैननिकल पेज को चुने जाने से रोकने के लिए, noindex का इस्तेमाल न करें. यह डायरेक्टिव, इंडेक्स से पेज को बाहर करने के लिए है, पसंद के कैननिकल पेज के चुनाव को मैनेज करने के लिए नहीं.
  • hreflang टैग इस्तेमाल करते समय, एक कैननिकल पेज ज़रूर चुनें. अपना कैननिकल पेज उसी भाषा में चुनें जिसमें आपका ओरिजनल वेबपेज है. अगर उस भाषा में कैननिकल पेज मौजूद न हो, तो उसके हिसाब से सबसे ठीक भाषा के पेज को चुनें.

  • अपनी साइट में लिंक करते समय, डुप्लीकेट यूआरएल के बजाय कैननिकल यूआरएल से लिंक करें. हमेशा कैननिकल यूआरएल से ही लिंक करने पर Google को आपकी पसंद समझने में आसानी होगी.

कैननिकल यूआरएल के लिए एचटीटीपी के बजाय एचटीटीपीएस को चुनना

Google एक जैसे पेजों के लिए, एचटीटीपी के बजाय एचटीटीपीएस पेजों को कैननिकल के तौर पर चुनता है. इसमें नीचे दी गई समस्याएं या आपस में टकराने वाले सिग्नल से जुड़े मामले शामिल नहीं हैं:

  • एचटीटीपीएस पेज में ऐसा एसएसएल सर्टिफ़िकेट शामिल हो जो गलत है.
  • एचटीटीपीएस पेज में ऐसी चीज़ें (इमेज के अलावा दूसरी चीज़ें) शामिल हैं जो सुरक्षित नहीं, लेकिन ज़रूरी हैं.
  • एचटीटीपीएस पेज, उपयोगकर्ताओं को किसी एचटीटीपी पेज पर या इसके ज़रिए दूसरे वेबलिंक पर भेजता है.
  • एचटीटीपीएस पेज में एचटीटीपी पेज का rel="canonical" link शामिल होता है.

हमारे सिस्टम डिफ़ॉल्ट तौर पर एचटीटीपी पेजों की जगह एचटीटीपीएस पेजों को ही चुनते हैं. हालांकि, इनमें से किसी भी कार्रवाई की मदद से यह तय किया जा सकता है कि ऐसा ही हो:

  • एचटीटीपी पेज से एचटीटीपीएस पेज पर भेजने के लिए रीडायरेक्ट जोड़ें.
  • एचटीटीपी पेज से एचटीटीपीएस पेज पर भेजने के लिए rel="canonical" link जोड़ें.
  • एचएसटीएस लागू करें.

Google को गलती से एचटीटीपी पेज को कैननिकल बनाने से रोकने के लिए, इन तरीकों का इस्तेमाल करने से बचें:

  • गलत TLS/एसएसएल सर्टिफ़िकेट इस्तेमाल करने और एचटीटीपीएस से एचटीटीपी पर रीडायरेक्ट करने से बचें. ऐसा होने पर Google, एचटीटीपी पेज को चुनना बहुत ज़रूरी मान लेता है. एचएसटीएस लागू करने पर भी Google, एचटीटीपी पेज को चुनना ज़रूरी मानता है.
  • अपने साइटमैप या hreflang कोडिंग में एचटीटीपीएस वर्शन के बजाय एचटीटीपी पेज को शामिल करने से बचें.
  • गलत होस्ट वैरिएंट के लिए, अपने एसएसएल/TLS सर्टिफ़िकेट का इस्तेमाल करने से बचें. उदाहरण के लिए, www.example.com की जगह example.com के लिए अपने सर्टिफ़िकेट का इस्तेमाल करने से बचें. सर्टिफ़िकेट, आपकी साइट के पूरे यूआरएल से मेल खाना चाहिए या फिर वह ऐसा वाइल्डकार्ड सर्टिफ़िकेट हो जिसे एक डोमेन के कई सबडोमेन के लिए इस्तेमाल किया जा सके.

अगर कोई पेज किसी अन्य पेज का डुप्लीकेट है, तो यह दिखाने के लिए, अपने एचटीएमएल के head सेक्शन में <link> टैग का इस्तेमाल किया जा सकता है.

मान लीजिए कि आप https://example.com/dresses/green-dresses को कैननिकल यूआरएल के तौर पर चुनना चाहते हैं, जबकि इस कॉन्टेंट को कई अन्य यूआरएल से भी ऐक्सेस किया जा सकता है. ऐसे में, इस यूआरएल को कैननिकल यूआरएल के तौर पर दिखाने के लिए यह तरीका अपनाएं:

  1. सभी डुप्लीकेट पेजों को rel="canonical" लिंक टैग से मार्क करें.

    कैननिकल पेज पर ले जाने के लिए, डुप्लीकेट पेजों के <head> सेक्शन में rel="canonical" एट्रिब्यूट वाला <link> एलिमेंट जोड़ें. उदाहरण के लिए:

    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
  2. अगर कैननिकल पेज का कोई मोबाइल वर्शन है, तो उस मोबाइल वर्शन पर ले जाने के लिए, पेज में rel="alternate" link जोड़ें:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">
  3. कोई भी hreflang या दूसरे रीडायरेक्ट जोड़ें, जो पेज के लिए सही हों.

rel="canonical" link टैग के साथ, रिलेटिव पाथ के बजाय ऐब्सलूट पाथ का इस्तेमाल करें.

ऐसे पाथ का इस्तेमाल करने का सुझाव दिया जाता है: https://www.example.com/dresses/green/greendress.html

ऐसे पाथ का इस्तेमाल करने का सुझाव नहीं दिया जाता है: /dresses/green/greendress.html

अगर आप rel="canonical" लिंक टैग जोड़ने के लिए JavaScript का इस्तेमाल करें, तो कैननिकल लिंक टैग को ठीक से इंजेक्ट करें.

rel="canonical" एचटीटीपी हेडर का इस्तेमाल करना

अगर आपके सर्वर को कॉन्फ़िगर करना मुमकिन है, तो Search के साथ काम करने वाले दस्तावेज़ का कैननिकल यूआरएल तय करने के लिए, rel="canonical" एचटीटीपी हेडर (एचटीएमएल टैग के बजाय) का इस्तेमाल किया जा सकता है. इसमें, PDF फ़ाइलों जैसे बिना एचटीएमएल वाले दस्तावेज़ भी शामिल हैं.

फ़िलहाल, Google पर यह तरीका सिर्फ़ वेब खोज के नतीजों के लिए काम करता है.

अगर आपकी कोई PDF फ़ाइल खोज के नतीजों में कई यूआरएल के ज़रिए दिखती है, तो rel="canonical" एचटीटीपी हेडर दिखाकर, Googlebot को यह बताया जा सकता कि PDF फ़ाइल का कैननिकल यूआरएल कौनसा है:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

rel="canonical" एचटीटीपी हेडर के लिए सुझाव वही हैं जो rel="canonical" link टैग के लिए हैं. आरएफ़सी2616 के मुताबिक, rel="canonical" एचटीटीपी हेडर में सिर्फ़ डबल कोट का इस्तेमाल करें.

साइटमैप का इस्तेमाल करना

अपने हर पेज के लिए एक कैननिकल यूआरएल चुनें और उसे साइटमैप में सबमिट करें. साइटमैप में दिए गए सभी पेजों को कैननिकल के तौर पर बताया गया है. कॉन्टेंट का मिलान करके, Google यह तय करेगा कि कौनसा पेज (अगर कोई है) डुप्लीकेट है.

हम इस बात की गारंटी नहीं देते हैं कि हम साइटमैप में दिए गए यूआरएल को कैननिकल मानेंगे. हालांकि, एक बड़ी साइट के लिए कैननिकल यूआरएल तय करने का यह एक आसान तरीका है. साथ ही, साइटमैप Google को यह बताने का एक अच्छा तरीका है कि आपके लिए, अपनी साइट पर कौनसे पेज सबसे ज़्यादा अहम हैं.

साइटमैप में ऐसे पेजों को शामिल न करें जो कैननिकल नहीं हैं. अगर आप किसी साइटमैप का इस्तेमाल कर रहे हैं, तो साइटमैप में सिर्फ़ कैननिकल यूआरएल के बारे में ही बताएं.

अब काम न करने वाले यूआरएल के लिए, 301 रीडायरेक्ट का इस्तेमाल करना

इस तरीके का इस्तेमाल तब करें, जब आप मौजूदा डुप्लीकेट पेजों से छुटकारा पाना चाहते हैं. हालांकि, आप पुराने यूआरएल का इस्तेमाल बंद करने से पहले यह पक्का कर लेना चाहते हैं कि इसे आसानी से बदला जा सके.

मान लेते हैं कि आपके पेज पर कई तरीकों से पहुंचा जा सकता है:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

इनमें से किसी एक यूआरएल को अपने कैननिकल यूआरएल के तौर पर चुनें और अन्य यूआरएल से अपने पसंदीदा यूआरएल में ट्रैफ़िक भेजने के लिए, 301 रीडायरेक्ट इस्तेमाल करें. सर्वर साइड पर 301 रीडायरेक्ट का होना, उपयोगकर्ताओं और सर्च इंजन को सही पेज पर ले जाने का सबसे अच्छा तरीका है. 301 स्थिति कोड का मतलब है कि किसी पेज को हमेशा के लिए किसी नई जगह पर ले जाया गया है.

अगर आप वेबसाइट होस्ट करने वाली किसी कंपनी की सेवा ले रहे हैं, तो 301 रीडायरेक्ट को सेट अप करने से जुड़े उनके दस्तावेज़ देखें.

समस्याओं को हल करना

अगर कोई कैननिकल यूआरएल ऐसी प्रॉपर्टी में है जिसके आप मालिक नहीं हैं, तो आप अपने डुप्लीकेट पेज का ट्रैफ़िक नहीं देख पाएंगे. यहां, कैननिकल पेज के किसी अलग प्रॉपर्टी में मौजूद होने की कुछ आम वजहें बताई गई हैं:

  • भाषा के गलत वैरिएंट चुनना: अगर आपकी ऐसी कई वेबसाइटें हैं जिनमें दुनिया भर के उपयोगकर्ताओं के लिए एक जैसा कॉन्टेंट उनकी स्थानीय भाषा में उपलब्ध कराया जाता है, तो अलग-अलग भाषा और इलाके के हिसाब से बनाई गई साइटों के लिए तय किए गए दिशा-निर्देशों का पालन ज़रूर करें.
  • गलत कैननिकल टैग: कुछ सीएमएस प्लग इन या कॉन्टेंट मैनेजमेंट सिस्टम (सीएमएस), यूआरएल के कैननिकल होने की जांच करने की तकनीकों का गलत इस्तेमाल कर सकते हैं. इससे वे आपकी साइट पर आने वाले उपयोगकर्ता या क्रॉलर को, किसी दूसरी साइट पर मौजूद यूआरएल पर भेज सकते हैं. देख लें कि कहीं आपके कॉन्टेंट में यह समस्या तो नहीं है. अगर आपकी साइट ऐसे यूआरएल को कैननिकल यूआरएल मान रही है जिसे आम तौर पर कैननिकल यूआरएल नहीं चुना जाना चाहिए, तो यह rel="canonical" के गलत इस्तेमाल या 301 रीडायरेक्ट की वजह से हो सकता है. इस समस्या को तुरंत ठीक करें.
  • गलत तरीके से कॉन्फ़िगर किए गए सर्वर: होस्ट करने की कुछ सेटिंग को गलत तरीके से सेट करने की वजह से, ऐसे क्रॉस-डोमेन यूआरएल को चुन लिया जाता है जिसे आम तौर पर नहीं चुना जाना चाहिए. उदाहरण के लिए:
    • कोई सर्वर गलत तरीके से कॉन्फ़िगर हो सकता है. ऐसा हाेने पर, b.com के किसी यूआरएल के लिए अनुरोध करने पर a.com का कॉन्टेंट दिख सकता है
    • दो अलग-अलग वेब सर्वर, एक जैसे सॉफ़्ट 404 गड़बड़ी वाले उन पेजों पर भेज सकते हैं जिन्हें Google, गड़बड़ी वाले पेजों के तौर पर पहचान नहीं पाया था.
  • नुकसान पहुंचाने के लिए की गई हैकिंग: वेबसाइटों पर किए गए कुछ हमलों में ऐसा कोड डाला जाता है जिसकी वजह से, अनुरोध के जवाब में एचटीटीपी 301 रीडायरेक्ट मिलता है. इसके अलावा, एचटीएमएल <head> या एचटीटीपी हेडर में, क्रॉस-डोमेन वाला ऐसा rel="canonical" लिंक टैग भी डाला जा सकता है जो अक्सर नुकसान पहुंचाने या स्पैम वाले कॉन्टेंट को होस्ट करने वाले यूआरएल पर भेजता है. इन मामलों में हमारे एल्गोरिदम, छेड़छाड़ की गई वेबसाइट पर मौजूद यूआरएल चुनने के बजाय, नुकसान पहुंचाने या स्पैम वाले यूआरएल को चुन सकते हैं.
  • नकली वेबसाइट: बहुत कम मामलों में, हमारा एल्गोरिदम किसी ऐसी बाहरी साइट से यूआरएल चुन सकता है जिस पर आपकी अनुमति के बिना आपका कॉन्टेंट मौजूद हो. अगर आपको लगता है कि कोई अन्य साइट, आपके कॉन्टेंट को डुप्लीकेट करके कॉपीराइट कानून का उल्लंघन कर रही है, तो आप उस साइट के होस्ट से कॉन्टेंट हटाने का अनुरोध कर सकते हैं. साथ ही, आप Google से भी यह अनुरोध कर सकते हैं कि कॉपीराइट के नियमाें का उल्लंघन करने वाले पेजों को खोज नतीजाें से हटा दिया जाए. इसके लिए, आप डिजिटल मिलेनियम कॉपीराइट ऐक्ट के तहत अनुरोध कर सकते हैं.