دليل حول أنظمة ترتيب النتائج في محرّك بحث Google
تستخدم Google أنظمة ترتيب مبرمَجة تستند إلى العديد من العوامل والإشارات المرتبطة بمئات المليارات من صفحات الويب وغير ذلك من المحتوى في فهرس "بحث Google"، وذلك بهدف عرض النتائج الأكثر صلة وأهمية، وكل ذلك في جزء من الثانية.
نحرص على تحسين هذه الأنظمة بشكلٍ منتظم من خلال أدوات اختبار وتقييم صارمة، ونقدّم إشعارات بالتحديثات التي نجريها على أنظمة الترتيب عندما نرى أنّ هذه الإشعارات قد تكون مجدية لصنّاع المحتوى وغيرهم.
يساعدك هذا الدليل على فهم بعض أنظمة الترتيب البارزة لدينا. ويتضمّن معلومات حول بعض الأنظمة التي تشكّل جزءًا من أنظمة الترتيب الأساسية لدينا، وهي التكنولوجيات الأساسية التي تعرض النتائج ردًّا على طلبات البحث. إضافةً إلى ذلك، يوفّر الدليل شرحًا حول بعض الأنظمة المرتبطة بتلبية احتياجات ترتيب معيَّنة.
يمكنك أيضًا الانتقال إلى موقعنا الإلكتروني حول "آلية عمل محرّك بحث Google" لفهم طريقة استخدام محرّك بحث Google لأنظمة الترتيب إلى جانب عمليات أخرى لكي يحقّق مهمتنا، وهي تنظيم المعلومات في جميع أنحاء العالم وإتاحة إمكانية الوصول إليها والاستفادة منها للجميع.
نماذج BERT
تمثيلات الترميز الثنائية الاتجاه من المحولات (المعروفة اختصارًا باسم BERT) هي نظام ذكاء اصطناعي تستخدمه Google ويسمح لنا بفهم كيفية تعبير مجموعات الكلمات عن معانٍ ودلالات مختلفة.
أنظمة المعلومات حول الأزمات
طوّرت Google أنظمة لتوفير معلومات مفيدة وفي الوقت المناسب عند حدوث الأزمات، سواء كانت أزمات شخصية أم كوارث طبيعية أم غيرها من الأزمات الواسعة الانتشار:
- الأزمات الشخصية: تسعى أنظمتنا إلى فهم الحالات التي يبحث فيها المستخدمون عن معلومات حول الأزمات الشخصية، وذلك بهدف عرض الخطوط الساخنة بالإضافة إلى محتوى من مؤسسات موثوق بها ردًّا على طلبات بحث معيّنة ذات صلة بالانتحار أو الاعتداء الجنسي أو تناول السموم أو العنف على أساس الجنس أو إدمان المخدرات. مزيد من المعلومات حول طريقة محرّك بحث Google في عرض معلومات حول الأزمات الشخصية
- إشعارات الطوارئ: خلال أوقات الكوارث الطبيعية أو الأزمات الواسعة الانتشار، يعرض نظام "إشعارات الطوارئ" الخاص بنا آخر المعلومات من السلطات المحلية أو الوطنية أو الدولية. قد تتضمن هذه المعلومات أرقام هواتف الطوارئ ومواقع إلكترونية وخرائط وترجمة لعبارات مفيدة وفرصًا للتبرع والمزيد. اطّلِع على مزيد من المعلومات حول طريقة عمل "إشعارات الطوارئ" وصِلتها بتنبيهات الطوارئ من Google والتي تساعد في أوقات الفيضانات وحرائق الغابات والزلازل والأعاصير والكوارث الأخرى.
أنظمة إزالة النتائج المكررة
قد تؤدي عمليات البحث على Google إلى ظهور الآلاف بل الملايين من صفحات الويب المطابقة، وبعضها يتشابه إلى حد كبير مع البعض الآخر. لتجنُّب التكرارات غير المفيدة في مثل هذه الحالات، تعرض أنظمتنا النتائج الأكثر صلة بموضوع البحث فقط. مزيد من المعلومات حول طريقة عمل تقنية إزالة التكرار وكيفية الاطّلاع على أي نتائج مكررة محذوفة عند الحاجة إليها
تتم أيضًا إزالة التكرار في حالة المقتطفات المميّزة. فإذا أصبحت بيانات إحدى صفحات الويب مقتطفًا مميزًا، لا نكرر تلك البيانات لاحقًا في الصفحة الأولى من النتائج. يساعد ذلك في تنظيم ظهور النتائج ويسهّل على المستخدمين الوصول إلى المعلومات الأكثر صلة بموضوع البحث.
نظام نطاقات المطابقة التامة
تستند أنظمة الترتيب إلى الكلمات التي تتألف منها أسماء النطاقات باعتبارها أحد العوامل العديدة المستخدَمة للتأكّد من ارتباط المحتوى بعبارة البحث. في المقابل، لا يعطي نظام نطاقات المطابقة التامة أفضليةً للمحتوى المستضاف ضمن النطاقات المصمَّمة لمطابقة طلبات بحث معيّنة بشكلٍ تام. على سبيل المثال، قد يختار المستخدم اسمًا للنطاق الخاص به يحتوي على الكلمات التالية: "أفضل-الأماكن-لتناول-الغداء"، وذلك بهدف الحصول على ترتيب أفضل ضمن نتائج البحث. في هذه الحالة، يدرك النظام هذه الاستراتيجية ويتعامل معها.
أنظمة المحتوى الحديث
لقد طوّرنا العديد من الأنظمة التي تعمل على عرض أحدث النتائج في الحالات التي تتطلب فيها طلبات البحث نتائج حديثة. على سبيل المثال، إذا كان المستخدم يبحث عن فيلم تم إطلاقه حديثًا، يكون هدفه على الأرجح الحصول على مراجعات حديثة عن الفيلم وليس مقالات قديمة تم نشرها أثناء مراحل إنتاجه. وكمثال آخر، يؤدي البحث عن كلمة "زلزال" عادةً إلى عرض مواد سابقة تتعلق بالاستعدادات والموارد المخصصة لهذا النوع من الكوارث. في المقابل، قد تظهر مقالات إخبارية ومحتوى أحدث في حال حدوث زلزال مؤخرًا.
أنظمة لتحليل الروابط وترتيب الصفحات
لقد طوّرنا أنظمة مختلفة بإمكانها فهم طريقة ارتباط الصفحات ببعضها بهدف معرفة محتواها وتحديد تلك الأكثر ملاءمة لطلب بحث معيّن، ومن بين هذه الأنظمة "نظام ترتيب الصفحات"، الذي كان أحد أهم أنظمة الترتيب عند إطلاق محرّك بحث Google. للمزيد من المعلومات عن "نظام ترتيب الصفحات"، يمكن الاطّلاع على الورقة البحثية الأصلية وبراءة الاختراع الخاصة بالنظام. لقد تطورت طريقة عمل "نظام ترتيب الصفحات" كثيرًا منذ بدء استخدامه، ولا يزال جزءًا من أنظمة الترتيب الأساسية لدينا.
أنظمة الأخبار المحلية
لقد طوّرنا أنظمة تعمل على تحديد مصادر الأخبار المحلية وعرضها متى كان ذلك مناسبًا، مثلاً من خلال ميزتَي "أهم الأخبار" و"أخبار محلية".
تقنية MUM
نظام النموذج الموحَّد للمهام المتعددة (MUM) هو نظام يعتمد على الذكاء الاصطناعي لفهم وصناعة المحتوى اللغوي. لم يعُد هذا النظام يُستخدَم في الترتيب العام على "بحث Google"، لكنّه يُستخدَم في بعض العمليات لأهداف مثل تحسين عمليات البحث عن معلومات متعلقة بلقاح فيروس كورونا المستجد (كوفيد-19) وتحسين وسائل الشرح التي نعرضها بشأن المقتطفات المميزة.
المطابقة العصبونية
المطابقة العصبونية هي نظام ذكاء اصطناعي تستخدمه Google لفهم تصوّرات المفاهيم في طلبات البحث والصفحات ومطابقتها مع بعضها البعض.
أنظمة المحتوى الأصلي
لقد طوّرنا أنظمة تساعد في ضمان عرض المحتوى الأصلي، بما في ذلك التقارير الأصلية، بشكلٍ بارز في نتائج البحث وفي ترتيب أعلى من الصفحات التي تقتبس هذا المحتوى. وتتيح هذه الأنظمة لصنّاع المحتوى استخدام ترميز خاص للصفحات الأساسية بهدف مساعدتنا في تحديد الصفحة الأساسية بسهولة أكبر، وذلك في حال كانت هناك نُسخ مكررة منها في عدة أماكن.
أنظمة خفض الترتيب بالاستناد إلى طلبات الإزالة
وضعت Google سياسات تسمح بإزالة أنواع معيّنة من المحتوى. وعندما نعالج عددًا كبيرًا من عمليات الإزالة المتعلقة بموقع إلكتروني معيّن، نستخدم ذلك كإشارة لتحسين نتائجنا. وعلى وجه الخصوص:
- عمليات الإزالة القانونية: When we receive a high volume of valid copyright removal requests involving a given site, we are able to use that to demote other content from the site in our results. This way, if there is other infringing content, people are less likely to encounter it versus the original content. We apply similar demotion signals to complaints involving defamation, counterfeit goods, and court-ordered removals. In the case of child sexual abuse material (CSAM), we always remove such content when it is identified and we demote all content from sites with a high proportion of CSAM content.
- عمليات إزالة المعلومات الشخصية: إذا عالجنا عددًا كبيرًا من عمليات إزالة المعلومات الشخصية وكانت تشمل موقعًا إلكترونيًا يتّبع ممارسات انتهازية لإزالة المحتوى، نخفض ترتيب محتوى آخر مُدرج في هذا الموقع الإلكتروني في نتائج البحث. نتأكّد أيضًا مما إذا كان نمط السلوك نفسه متبَّعًا في مواقع إلكترونية أخرى، وفي هذه الحالة، نخفض ترتيب المحتوى على تلك المواقع. قد نطبّق إجراءات خفض الترتيب نفسها على المواقع الإلكترونية التي تتلقّى عددًا كبيرًا من عمليات إزالة المحتوى، بما في ذلك محتوى جمع المعلومات الشخصية أو الصور الشخصية الفاضحة التي تم إنشاؤها أو التقاطها بدون موافقة الشخص المعني أو المحتوى الفاضح والزائف بدون موافقة الشخص المعني.
نظام لترتيب الفقرات
ترتيب الفقرات هو نظام يعتمد على الذكاء الاصطناعي نستخدمه لتحديد الأقسام الفردية أو "الفقرات" ضمن صفحة الويب لنفهم بشكلٍ أفضل مدى صلة الصفحة بعبارة البحث.
نظام RankBrain
RankBrain هو نظام يعتمد على الذكاء الاصطناعي ويساعدنا في معرفة مدى صلة الكلمات بالمفاهيم. ويساهم ذلك في عرض المحتوى ذي الصلة بطلب البحث حتى لو لم يكن يتضمّن جميع الكلمات المستخدَمة بالضبط، وذلك من خلال فهم أنّ المحتوى مرتبط بكلمات ومفاهيم أخرى.
أنظمة المعلومات الموثوق بها
نوفّر أنظمة متعددة تعمل بطرق مختلفة لإظهار المعلومات الأكثر موثوقية، مثلاً من خلال المساعدة في عرض المزيد من الصفحات الموثوقة وخفض ترتيب المحتوى المنخفض الجودة وتحسين ظهور المحتوى الصحفي العالي الجودة. في حال عدم توفّر معلومات موثوق بها، تعرض أنظمتنا تلقائيًا إشعارات بشأن المحتوى متعلقة بالمواضيع السريعة التغيّر، ويحدث ذلك أيضًا عندما لا تتوفّر لدى أنظمتنا ثقة عالية في جودة النتائج المتاحة عن عبارة البحث. توفّر هذه الإشعارات نصائح حول كيفية الحصول على نتائج أكثر فائدة من خلال تحسين طريقة البحث. مزيد من المعلومات حول طريقتنا في تقديم معلومات عالية الجودة في "بحث Google"
نظام المراجعات
يهدف نظام المراجعات إلى تعزيز ترتيب المراجعات العالية الجودة، وهي عبارة عن محتوى يقدّم تحليلاً مفيدًا وأبحاثًا أصلية ويكون صادرًا عن خبراء في المجال أو عن جهات مطّلعة على الموضوع.
نظام تنوع المواقع الإلكترونية
يساعد نظام تنوع المواقع الإلكترونية في ضمان ألّا يظهر ضمن أهم النتائج أكثر من بطاقتَي بيانات خاصة بصفحات ويب من الموقع الإلكتروني نفسه، وذلك كي لا يهيمن أي موقع على أهم النتائج. في المقابل، قد نعرض أكثر من بطاقتَي بيانات في الحالات التي تحدد فيها أنظمتنا أنّ هذا الإجراء مناسب بشكلٍ خاص لعبارة بحث معيَّنة. يتعامل نظام تنوّع المواقع الإلكترونية بشكل عام مع النطاقات الفرعية باعتبارها جزءًا من نطاق جذر. بمعنى آخر، يتم اعتبار مصدر البيانات من النطاق الفرعي (subdomain.example.com) والنطاق الجذر (example.com) هو موقع إلكتروني واحد، لكن في بعض الأحيان، يتم التعامل مع النطاقات الفرعية كمواقع إلكترونية منفصلة لأغراض التنويع عند الضرورة.
أنظمة رصد المحتوى غير المرغوب فيه
لا أحد يريد أن يكون صندوق بريده الإلكتروني مليئًا بالرسائل غير المرغوب فيها، ومن هنا أهمية فلاتر الرسائل غير المرغوب فيها. يواجه محرّك بحث Google تحديًا مشابهًا، لأنّ شبكة الإنترنت تتضمن كميات هائلة من المحتوى غير المرغوب فيه الذي قد يمنعنا من عرض النتائج الأكثر فائدة وصلة بعبارات البحث ما لم تتم معالجته. لهذا السبب، نستخدم مجموعة من أنظمة رصد المحتوى غير المرغوب فيه، من بينها نظام SpamBrain، بهدف معالجة أشكال المحتوى والسلوكيات التي تنتهك سياسات المحتوى غير المرغوب فيه. يتم تحديث هذه الأنظمة باستمرار لكي تواكب أحدث الطرق التي يتطور بها التهديد الناتج عن المحتوى غير المرغوب فيه.
أنظمة تمت إزالتها
يُرجى العلم أنّ الأنظمة التالية هي فقط لأغراض مرجعية، وهي إمّا دُمجت في أنظمة أحدث أو أصبحت جزءًا من أنظمة الترتيب الأساسية لدينا.
نظام لعرض المحتوى المساعِد
أُعلِن عن النظام في 2022 تحت عنوان "تحديث بشأن المحتوى المساعِد"، وقد تم تصميمه لضمان ظهور محتوى أصلي ومفيد للمستخدمين، وللتأكد من أنّ المحتوى المعروض كتبه أشخاص وموجَّه للمستخدمين ولا يهدف في الأساس إلى جذب الزيارات من محرك البحث. في مارس 2024، تطوّر النظام ليصبح جزءًا من أنظمة الترتيب الأساسية لدينا التي تستخدم مجموعة متنوعة من الإشارات والنظم من أجل تقديم نتائج مفيدة للمستخدمين.
نظام Hummingbird
كان هذا النظام دليلاً على تحسُّن كبير في أنظمة الترتيب العامة لدينا، وهو نظام تم ابتكاره في آب (أغسطس) 2013. ومنذ ذلك الحين، تطوّرت أنظمة الترتيب المستخدَمة لدينا لتشهد الكثير من التغييرات كما كانت الحال قبل استخدام ذلك النظام.
نظام Panda
تم تصميم هذا النظام لضمان ظهور المحتوى الأصلي والعالي الجودة في ترتيب أفضل ضمن نتائج البحث. وقد تم الإعلان عنه في عام 2011 وأُطلِق عليه اسم Panda وأصبح جزءًا من أنظمة التصنيف الأساسية لدينا في عام 2015.
نظام Penguin
تم تصميم هذا النظام بهدف التصدي للروابط غير المرغوب فيها. وقد تم الإعلان عنه في عام 2012 وأُطلِق عليه اسم "تحديث Penguin" وتم دمجه في أنظمة الترتيب الأساسية لدينا في عام 2016.