Google Search के रैंकिंग सिस्टम के बारे में गाइड
Google अपने-आप काम करने वाले सिस्टम का इस्तेमाल करता है. ये सिस्टम हमारे Search इंडेक्स में मौजूद सैकड़ों अरबों वेब पेजों के लिए बहुत सारे फ़ैक्टर और सिग्नल को ध्यान में रखते हैं, ताकि आपको कुछ ही सेकंड में सटीक और मददगार नतीजे मिल सकें.
हम इन सिस्टम को बेहतर बनाने के लिए, इनकी गहराई से जांच और आकलन करते हैं. साथ ही, ज़रूरी होने पर हम रैंकिंग सिस्टम से जुड़े अपडेट की सूचना कॉन्टेंट क्रिएटर्स और अन्य लोगों को देते हैं.
यह पेज एक गाइड है, जिससे आपको हमारे बेहतरीन रैंकिंग सिस्टम को समझने में मदद मिलती है. इस गाइड में कुछ ऐसे सिस्टम के बारे में बताया गया है जो हमारे मुख्य रैंकिंग सिस्टम का हिस्सा हैं. ये सिस्टम, उन टेक्नोलॉजी का इस्तेमाल करते हैं जो क्वेरी के हिसाब से खोज के नतीजे दिखाती हैं. इस गाइड में कुछ ऐसे सिस्टम के बारे में भी बताया गया है जो रैंकिंग की खास ज़रूरतों से जुड़े हैं.
Search के काम करने का तरीका बताने वाली साइट पर जाएं. इससे आपको यह जानकारी मिलेगी कि हमारे रैकिंग सिस्टम अन्य प्रोसेस के साथ मिलकर कैसे काम करते हैं, ताकि Google Search दुनिया भर की जानकारी इकट्ठा करे और उसे सभी तक पहुंचाने और इस्तेमाल करने लायक बनाने के हमारे मकसद को पूरा कर सके.
BERT
बाईडायरेक्शनल एन्कोडर रिप्रज़ेंटेशंस फ़्रॉम ट्रांसफ़ॉर्मर्स (BERT) एक एआई (AI) सिस्टम है, जिसका इस्तेमाल Google करता है. इससे यह समझने में मदद मिलती है कि शब्दों के कॉम्बिनेशन कैसे अलग-अलग मतलब और मकसद बताते हैं.
मुसीबत की चेतावनी देने वाले सिस्टम
Google ने ऐसे सिस्टम डेवलप किए हैं जो मुसीबत में मददगार और समय पर जानकारी देते हैं. भले ही, इसमें निजी परेशानियां, प्राकृतिक आपदाएं या अन्य गंभीर मुसीबत की स्थितियां शामिल हों:
- निजी परेशानियां: हमारे सिस्टम, लोगों के लिए भरोसेमंद सोर्स से निजी परेशानियों के लिए इमरजेंसी हॉटलाइन की सुविधा और कॉन्टेंट उपलब्ध कराते हैं. इसमें आत्महत्या, यौन शोषण, ज़हर खाने, लिंग के आधार पर होने वाली हिंसा या नशे की लत से जुड़ी कोई खास क्वेरी जैसे विषय शामिल होते हैं. निजी परेशानियों से जुड़ी जानकारी को Google Search पर दिखाने के बारे में ज़्यादा जानें.
- SOS Alerts: हमारा SOS Alerts सिस्टम, प्राकृतिक आपदाओं या गंभीर मुसीबत की स्थितियों के दौरान स्थानीय, राष्ट्रीय या अंतरराष्ट्रीय अथॉरिटी से मिले अपडेट दिखाता है. इन अपडेट में आपातकालीन फ़ोन नंबर, वेबसाइटें, मैप, मददगार वाक्यांशों के अनुवाद, दान देने के अवसर वगैरह शामिल हो सकते हैं. SOS Alerts के काम करने के तरीके के बारे में ज़्यादा जानें. साथ ही, यह जानें कि SOS Alerts कैसे Google के मुसीबत की चेतावनी वाले सिस्टम का हिस्सा है, जो बाढ़, जंगल में लगी आग, तूफ़ान, भूकंपों, और अन्य आपदाओं के समय मदद करता है.
डुप्लीकेट कॉपी हटाने वाले सिस्टम
जब Google पर खोज की जाती है, तो आपको मिलते-जुलते नतीजों वाले हज़ारों या लाखों वेब पेज मिलते हैं. इनमें से कुछ नतीजे एक-दूसरे से काफ़ी मिलते-जुलते हो सकते हैं. ऐसे मामलों में, डुप्लीकेट कॉन्टेंट से बचने के लिए, हमारे सिस्टम सिर्फ़ काम के नतीजे दिखाते हैं. डुप्लीकेट कॉपी हटाने वाले सिस्टम कैसे काम करते हैं और डुप्लीकेट होने पर हटाए गए नतीजों को देखने के तरीके के बारे में ज़्यादा जानें.
डुप्लीकेट कॉपी हटाने वाले सिस्टम फ़ीचर्ड स्निपेट पर भी काम करते हैं. अगर किसी वेब पेज लिस्टिंग को फ़ीचर्ड स्निपेट के तौर पर दिखाया जाता है, तो हम उस लिस्टिंग को नतीजों के पहले पेज पर बार-बार नहीं दिखाते. इससे नतीजों को व्यवस्थित करने में मदद मिलती है और लोग आसानी से काम की जानकारी ढूंढ पाते हैं.
एग्ज़ैक्ट मैच दिखाने वाला डोमेन सिस्टम
हमारे रैंकिंग सिस्टम डोमेन नेम में इस्तेमाल हुए शब्दों को भी एक अहम फ़ैक्टर मानते हैं, जो यह तय करते हैं कि कॉन्टेंट खोज के हिसाब से सही है या नहीं. हालांकि, एग्ज़ैक्ट मैच दिखाने वाला डोमेन सिस्टम यह पक्का करता है कि हम उन डोमेन पर होस्ट किए गए कॉन्टेंट को ज़्यादा क्रेडिट न दें जो खास तौर पर क्वेरी से मेल खाते हों. उदाहरण के लिए, ऐसा हो सकता है कि कोई व्यक्ति अपने कॉन्टेंट की रैंकिंग को बढ़ाने के लिए, अपने डोमेन नेम में "लंच-करने-के-लिए-सबसे-बढ़िया-जगह" जैसे शब्दों का इस्तेमाल करे. ऐसा करने के पीछे उसका मकसद, अपने वेब पेज को खोज के नतीजों में सबसे ऊपर दिखाना हो सकता है. हमारा सिस्टम ज़रूरत के मुताबिक बदलाव करता है.
अप-टू-डेट कॉन्टेंट दिखाने वाले सिस्टम
हमारे पास "क्वेरी के हिसाब से अप-टू-डेट कॉन्टेंट" दिखाने के लिए बहुत से सिस्टम मौजूद हैं. इन्हें ज़रूरत के हिसाब से सही जगह पर क्वेरी के अप-टू-डेट नतीजे दिखाने के लिए डिज़ाइन किया गया है. उदाहरण के लिए, अगर किसी व्यक्ति को हाल ही में रिलीज़ हुई फ़िल्म के बारे में देखना है, तो वह फ़िल्म बनने के दौरान पब्लिश हुए पुराने लेखों को पढ़ने के बजाय, हाल ही की समीक्षाएं पढ़ना ज़्यादा पसंद करेगा. एक अन्य उदाहरण यह है कि आम तौर पर "भूकंप" के बारे में खोजने पर, आपको उससे बचने के तरीकों और संसाधनों से जुड़ी जानकारी भी दिख सकती है. हालांकि, अगर हाल ही में भूकंप आया है, तो आपको समाचार के लेख और नया कॉन्टेंट दिखेगा.
मददगार कॉन्टेंट दिखाने वाला सिस्टम
हमारे मददगार कॉन्टेंट दिखाने वाले सिस्टम को यह पक्का करने के लिए डिज़ाइन किया गया है कि सर्च इंजन में ट्रैफ़िक हासिल करने के मकसद से बनाए गए कॉन्टेंट के बजाय, ऐसे खोज के नतीजे दिखें जिनसे लोगों को ओरिजनल और दूसरों का लिखा हुआ मददगार कॉन्टेंट मिले.
लिंक के आधार पर किया जाने वाले विश्लेषण सिस्टम और PageRank
हम कई सिस्टम का इस्तेमाल करते हैं, जो यह समझने में मदद करते हैं कि पेज एक-दूसरे से कैसे लिंक हैं. साथ ही, ये तय करते हैं कि कौनसे पेज किस बारे में हैं और क्वेरी के जवाब के तौर पर कौनसे पेज मददगार हैं. Google के लॉन्च होने के बाद से PageRank, हमारे मुख्य रैंकिंग सिस्टम में से एक है. अगर आपको इसके बारे में ज़्यादा जानना है, तो ओरिजनल PageRank के रिसर्च पेपर और पेटेंट पढ़े जा सकते हैं. PageRank के काम करने का तरीका तब से काफ़ी बेहतर हो चुका है और यह हमारे मुख्य रैंकिंग सिस्टम का हिस्सा बना हुआ है.
स्थानीय खबरें दिखाने वाले सिस्टम
हमारे पास ऐसे सिस्टम हैं जो ज़रूरी जगहों पर स्थानीय खबरों के सोर्स को पहचानने और उन्हें दिखाने के लिए काम करते हैं. जैसे, "टॉप स्टोरीज़" "स्थानीय खबरों" की सुविधाएं.
एमयूएम
मल्टीटास्क यूनिफ़ाइड मॉडल ( एमयूएम), एक ऐसा एआई (AI) सिस्टम है जो भाषा को समझने के साथ-साथ जनरेट भी कर सकता है. फ़िलहाल, इसका इस्तेमाल सामान्य रैंकिंग के लिए नहीं किया जाता है, बल्कि खास ऐप्लिकेशन के लिए किया जाता है. जैसे, COVID-19 टीकाकरण की जानकारी को बेहतर बनाना और दिखाए जाने वाले फ़ीचर्ड स्निपेट कॉलआउट को बेहतर बनाना.
न्यूरल मैचिंग
न्यूरल मैचिंग एक एआई (AI) सिस्टम है, जिसका इस्तेमाल Google, क्वेरी और पेजों के कॉन्सेप्ट को समझने और उन्हें एक-दूसरे से मैच करने के लिए करता है.
ओरिजनल कॉन्टेंट दिखाने वाले सिस्टम
हम सिर्फ़ इस बात का हवाला ही नहीं देते, बल्कि हमारे पास ऐसे सिस्टम मौजूद हैं जिनकी मदद से हम अपने खोज के नतीजों में खास तौर पर ओरिजनल कॉन्टेंट दिखाते हैं. इनमें ओरिजनल रिपोर्टिंग शामिल है. इसमें कैननिकल मार्कअप से मिलने वाली मदद शामिल हैं. जिसका इस्तेमाल करके क्रिएटर्स, अलग-अलग जगहों पर मौजूद डुप्लीकेट पेजों के बीच मुख्य पेज को आसानी से खोज सकते हैं.
रैंकिंग कम करके कॉन्टेंट हटाने वाले सिस्टम
Google की ऐसी नीतियां, कुछ खास तरह के कॉन्टेंट को हटाने की अनुमति देती हैं. अगर हमें किसी खास साइट से, कॉन्टेंट हटाने के बहुत ज़्यादा अनुरोध मिलते हैं, तो हम उनका इस्तेमाल हमारे खोज के नतीजों को बेहतर बनाने से जुड़े सिग्नल के तौर पर करते हैं. खास तौर पर:
- कानूनी रूप से हटाना: जब हमें किसी साइट को लेकर बहुत ज़्यादा संख्या में कॉपीराइट उल्लंघन की वजह से, कॉन्टेंट हटाने के मान्य अनुरोध मिलते हैं, तबहम उनका इस्तेमाल, अपने खोज नतीजों में साइट के अन्य कॉन्टेंट की रैंकिंग कम करने के लिए करते हैं. इस तरह, अगर साइट पर उल्लंघन करने वाला अन्य कॉन्टेंट मौजूद है, तो इस बात की संभावना कम होती है कि साइट इस्तेमाल करने वाले लोगों को ओरिजनल कॉन्टेंट के बजाय, उल्लंघन करने वाला कॉन्टेंट दिखे. हम अन्य तरह की शिकायतों पर भी कॉन्टेंट की रैंकिंग घटाने के सिग्नल का इस्तेमाल करते हैं. इनमें अदालत के आदेश पर कॉन्टेट हटाने के साथ-साथ मानहानि और नकली सामान की जानकारी देने वाला कॉन्टेंट हटाने से जुड़ी शिकायतें शामिल हैं.
- निजी जानकारी हटाना: अगर हमें ऐसी साइट से निजी जानकारी हटाने के बहुत ज़्यादा अनुरोध मिलते हैं जिस पर कॉन्टेंट हटाने के तरीकों का गलत इस्तेमाल किया जाता है, तो हम अपने खोज नतीजों में उस साइट के अन्य कॉन्टेंट की रैंकिंग भी कम कर देते हैं. हम इस बात की भी जांच करते हैं कि क्या दूसरी साइटों पर भी इसी तरह के तरीके इस्तेमाल किए जा रहे हैं. अगर ऐसा है, तो हम उन साइटों के कॉन्टेंट की रैंकिंग भी कम कर देते हैं. हम उन साइटों के कॉन्टेंट की रैंकिंग भी कम कर सकते हैं जिनके लिए डॉक्सिंग कॉन्टेंट हटाने के बहुत ज़्यादा अनुरोध मिलते हैं. हमारे पास सुरक्षा मुहैया कराने के लिए अपने-आप काम करने वाले सिस्टम हैं. ये सिस्टम, आपकी सहमति के बिना सार्वजनिक की गई अश्लील निजी इमेज को क्वेरी के जवाब में सबसे पहले दिखने से रोकते हैं.
पेज की परफ़ॉर्मेंस से जुड़े सिस्टम
लोग ऐसी साइटें पसंद करते हैं जो पेज की अच्छी परफ़ॉर्मेंस उपलब्ध कराती हैं. इस वजह से, हमारे पास पेज की परफ़ॉर्मेंस से जुड़ा एक सिस्टम है, जो अलग-अलग चीज़ों का आकलन करता है. जैसे, पेज कितनी तेज़ी से लोड हो रहे हैं और पेज मोबाइल फ़्रेंडली है या नहीं. साथ ही, पेजों पर अचानक कुछ ऐसे एलिमेंट दिखने लगते हैं जो लोगों को कॉन्टेंट देखने से रोकते हैं और पेज सुरक्षित तौर से दिखाए जाते हैं या नहीं, इसका आकलन भी किया जाता है. ज़रूरत के मुताबिक कई मिलते-जुलते कॉन्टेंट मौजूद होने पर, हमारा सिस्टम बेहतर पेज की परफ़ॉर्मेंस वाले कॉन्टेंट को प्राथमिकता देता है.
पैसेज रैंकिंग सिस्टम
पैसेज रैंकिंग, एक एआई (AI) सिस्टम है, जिसका इस्तेमाल हम किसी वेब पेज के अलग-अलग सेक्शन या "पैसेज" की पहचान करने के लिए करते हैं. साथ ही, इससे यह बेहतर तरीके से समझा जा सकता है कि कोई पेज खोज के हिसाब से कितना सही है.
प्रॉडक्ट की समीक्षाओं से जुड़ा सिस्टम
प्रॉडक्ट की समीक्षाओं से जुड़े सिस्टम का मकसद, अच्छी क्वालिटी वाले प्रॉडक्ट की समीक्षाओं और कॉन्टेंट को बढ़ावा देना है. इनमें अहम जानकारी वाला विश्लेषण और ओरिजनल रिसर्च शामिल है, जिसे विशेषज्ञों या विषय की अच्छी समझ रखने वाले लोगों ने लिखा है.
RankBrain
RankBrain एक एआई (AI) सिस्टम है. इससे हमें यह समझने में मदद मिलती है कि शब्द कॉन्सेप्ट से किस तरह जुड़े हैं. इसका मतलब है कि हम ऐसे कॉन्टेंट को बेहतर तरीके से दिखा सकते हैं जिसमें खोज के लिए इस्तेमाल किए गए सभी शब्द शामिल न हों. इससे यह समझने में मदद मिलती है कि कॉन्टेंट दूसरे शब्दों और कॉन्सेप्ट से जुड़ा है.
भरोसेमंद जानकारी देने वाले सिस्टम
सबसे भरोसेमंद जानकारी दिखाने के लिए, अलग-अलग सिस्टम कई तरीकों से काम करते हैं. जैसे, ज़्यादा भरोसेमंद पेजों को दिखाने में मदद करना, खोज के नतीजों में खराब क्वालिटी वाले कॉन्टेंट की रैंकिंग कम करना, और बेहतर क्वालिटी की पत्रकारिता को बढ़ावा देना. जब भरोसेमंद जानकारी उपलब्ध नहीं होती है, तो हमारे सिस्टम तेज़ी से बदलते विषयों के लिए अपने-आप कॉन्टेंट से जुड़ी सलाह दिखाते हैं. ऐसा तब होता है, जब उन्हें खोज के नतीजों की क्वालिटी पर पूरा भरोसा नहीं होता है. इनमें उन तरीकों के बारे में सलाह दी गई है जिनका इस्तेमाल करके, ज़्यादा मददगार नतीजे पाए जा सकते हैं. Search में अच्छी क्वालिटी की जानकारी देने के हमारे तरीके के बारे में ज़्यादा जानें.
साइट डाइवर्सिटी सिस्टम
हमारे साइट डाइवर्सिटी सिस्टम की मदद से, हम आम तौर पर अपने सबसे अच्छे नतीजों में, एक ही साइट की दो से ज़्यादा वेब पेज लिस्टिंग नहीं दिखाते हैं. इसकी वजह से, एक ही साइट के वेब पेज सबसे ऊपर दिखने वाले खोज के नतीजों में नहीं दिखेंगे. हालांकि, हम अब भी उन मामलों में दो से ज़्यादा लिस्टिंग दिखा सकते हैं. जब हमारे सिस्टम यह तय करते हैं कि किसी खास खोज के लिए ऐसा करना ज़रूरी है. आम तौर पर, यह सिस्टम सबडोमेन को रूट डोमेन का हिस्सा मानता है. उदाहरण के लिए, सबडोमेन (subdomain.example.com) और रूट डोमेन (example.com) दोनों से जुड़ी लिस्टिंग को एक ही साइट का हिस्सा माना जाएगा. कई बार सबडोमेन को अलग-अलग साइटों के तौर पर माना जाता है. हालांकि, ऐसा सिर्फ़ ज़रूरत पड़ने पर किया जाता है.
स्पैम का पता लगाने वाले सिस्टम
ऐसा कोई भी नहीं चाहता कि उसके ईमेल के इनबॉक्स में स्पैम आए. इसलिए, स्पैम फ़िल्टर काफ़ी मददगार होते हैं. Search भी इसी तरह की चुनौती का सामना करता है. ऐसा इसलिए है, क्योंकि इंटरनेट पर बड़ी संख्या में स्पैम मौजूद हैं. अगर इसे नहीं रोका गया, तो हम सही और मददगार नतीजे नहीं दिखा पाएंगे. हम स्पैम का पता लगाने वाले सिस्टम का इस्तेमाल करते हैं. इसमें SpamBrain शामिल है. ऐसा उन कॉन्टेंट और गतिविधियों को रोकने के लिए किया जाता है जो स्पैम से जुड़ी नीतियों का उल्लंघन करते हैं. ये सिस्टम, उन नए तरीकों की जानकारी पाने के लिए लगातार अपडेट किए जाते हैं जिनसे स्पैम के खतरों में बढ़ोतरी हो रही है.
रिटायर्ड सिस्टम
यहां दिए गए सिस्टम ऐतिहासिक वजहों से बनाए गए हैं. इन्हें या तो नए सिस्टम में शामिल कर दिया गया है या हमारे मुख्य रैंकिंग सिस्टम का हिस्सा बना दिया गया है.
हमिंगबर्ड
अगस्त 2013 में बनाए गए हमारे रैंकिंग सिस्टम में यह एक बहुत बड़ा सुधार है. इसके बाद से हमारे रैंकिंग सिस्टम लगातार बेहतर हो रहे हैं. पहले भी इनमें बदलाव होते रहे हैं.
मोबाइल-फ़्रेंडली रैंकिंग सिस्टम
ज़रूरत के मुताबिक कई मिलते-जुलते कॉन्टेंट मौजूद होने पर मोबाइल-फ़्रेंडली रैंकिंग सिस्टम, मोबाइल डिवाइस पर बेहतर तरीके से दिखने वाले कॉन्टेंट को प्राथमिकता देता है. ऐसा इसलिए किया जाता है, क्योंकि मोबाइल-फ़्रेंडली कॉन्टेंट उन डिवाइसों पर जानकारी खोजने वाले लोगों के लिए ज़्यादा मददगार है. इस सिस्टम को हमारे पेज की परफ़ॉर्मेंस के बारे में बताने वाले सिस्टम में शामिल किया गया है.
पेज स्पीड सिस्टम
इस सिस्टम का एलान 2018 में किया गया है. इसे मूल रूप से “स्पीड अपडेट” कहा जाता है. इसके हिसाब से जब सभी चीज़ें एक समान होती हैं, तो मोबाइल इस्तेमाल करने वाले लोगों के लिए, तेज़ी से लोड होने वाले कॉन्टेंट से मोबाइल पर दिखने वाले खोज के नतीजे बेहतर होंगे. तब से अब तक यह हमारे पेज की परफ़ॉर्मेंस का हिस्सा बन गया है.
Panda सिस्टम
इस सिस्टम को यह पक्का करने के लिए डिज़ाइन किया गया है कि हमारे खोज के नतीजों में अच्छी क्वालिटी के साथ-साथ ओरिजनल कॉन्टेंट दिखे. इसका एलान 2011 में किया गया और इसे "Panda" नाम दिया गया. साथ ही, यह 2015 में हमारे मुख्य रैंकिंग सिस्टम का हिस्सा बन गया.
पेंगुइन सिस्टम
यह सिस्टम, स्पैम वाली लिंक को रोकने के लिए डिज़ाइन किया गया है. इसका एलान 2012 में किया गया और इसे "पेंगुइन अपडेट" नाम दिया गया. साथ ही, 2016 में इसे हमारे मुख्य रैंकिंग सिस्टम में इंटिग्रेट किया गया.
सुरक्षित साइट सिस्टम
इस सिस्टम का एलान 2014 में किया गया था. इसके हिसाब से सभी चीजे़ं एक समान होने पर एचटीटीपीएस से सुरक्षित साइटें, हमारे रैंकिंग सिस्टम में बेहतर काम करेंगी. इसने उस समय सुरक्षित साइटों के इस्तेमाल को बढ़ावा दिया जब एचटीटीपीएस का इस्तेमाल करना काफ़ी मुश्किल था. तब से यह हमारे पेज की परफ़ॉर्मेंस से जुड़े सिस्टम का हिस्सा है.