دليل مفصّل حول طريقة عمل محرك بحث Google
"بحث Google" هو محرّك بحث مبرمَج بشكل كامل يستخدم برامج تُعرف باسم برامج الزحف لاستكشاف الويب بشكل منتظم والعثور على الصفحات لإضافتها إلى فهرسنا. في الواقع، إنّ الغالبية العظمى من الصفحات المضمّنة في نتائجنا ليست ناتجة عن إرسالها يدويًا، بل تم العثور عليها وإضافتها تلقائيًا عند زحف برامجنا إلى الويب. يشرح هذا المستند المراحل التي تشملها طريقة عمل "بحث Google" في سياق عمل موقعك الإلكتروني. وقد تساعدك هذه المعلومات الأساسية في حلّ المشاكل المتعلقة بالزحف وتهيئة صفحاتك لتتم فهرستها والتعرّف على كيفية تحسين ظهور موقعك الإلكتروني في "بحث Google".
إليك بعض الملاحظات قبل البدء
قبل التعمّق في تفاصيل طريقة عمل "بحث Google"، نذكّر أنّ Google لا تقبل تلقّي دفعات مالية مقابل زيادة عدد مرات زحف محرّك بحثها إلى موقع إلكتروني أو منح الموقع الإلكتروني ترتيبًا أفضل في نتائج البحث. وأي معلومات تناقض ذلك هي غير صحيحة.
لا يضمن محرّك بحث Google إمكانية الزحف إلى صفحتك وفهرستها وعرضها، حتى إذا كانت الصفحة تتّبع أساسيات "بحث Google".
إليك المراحل الثلاث لعمل محرّك بحث Google
ينقسم عمل محرّك بحث Google إلى ثلاث مراحل، وبعض الصفحات لا تنجح في اجتياز كل مرحلة:
- الزحف: ينزّل محرّك بحث Google النص والصور والفيديوهات من الصفحات التي يعثر عليها على الإنترنت باستخدام برامج مبرمَجة تُعرف باسم برامج الزحف.
- الفهرسة: يحلّل محرّك بحث Google النص والصور وملفات الفيديو المضمَّنة على الصفحة ويحفظ المعلومات في فهرس Google، وهو قاعدة بيانات ضخمة.
- عرض نتائج البحث: عندما يجري المستخدم عملية بحث على Google، يعرض محرّك البحث معلومات ذات صلة بطلب بحث المستخدم.
الزحف
المرحلة الأولى هي اكتشاف الصفحات المنشورة على الويب. ليس هناك سجلّ مركزي يضم جميع صفحات الويب، لذا على محرّك بحث Google أن يبحث باستمرار عن الصفحات الجديدة والمُعدّلة وأن يضيفها إلى قائمة الصفحات المعروفة لديه. تُعرف هذه العملية باسم "اكتشاف عناوين URL". تكون بعض الصفحات معروفة، لأنّ محرّك بحث Google سبق أن زارها. يكتشف محرّك بحث Google صفحات أخرى عندما يتتبّع رابطًا مضمّنًا في صفحة معروفة ويؤدي إلى صفحة جديدة، على سبيل المثال، تؤدّي صفحة المركز، مثل صفحة الفئة، إلى منشور مدونة جديد. وهناك صفحات أخرى يكتشفها محرّك بحث Google عندما ترسل أنت قائمة صفحات (خريطة موقع) تريد أن يزحف إليها محرّك البحث.
عندما يكتشف محرّك بحث Google عنوان URL الخاص بصفحة، قد يزور (أو "يزحف إلى") الصفحة لاكتشاف المحتوى المضمَّن فيها. نحن نستخدم مجموعة ضخمة من أجهزة الكمبيوتر للزحف إلى المليارات من الصفحات على الويب. ويُطلق على البرنامج الذي يجلب الصفحات اسم Googlebot (ويُعرف أيضًا باسم زاحف أو برنامج روبوت أو برنامج تتبُّع أو برنامج عنكبوت). يستخدم Googlebot عملية تعتمد على الخوارزميات لتحديد المواقع الإلكترونية التي يزحف إليها ووتيرة الزحف وعدد الصفحات التي يجلبها من كل موقع إلكتروني. تتم برمجة برامج زحف Google أيضًا لتحاول عدم الزحف إلى الموقع الإلكتروني بشكل سريع جدًا لتجنُّب تحميله عبئًا زائدًا. وتستند هذه الطريقة إلى استجابات الموقع الإلكتروني (على سبيل المثال، تعني أخطاء HTTP 500 ضرورة "تخفيض معدّل الزحف").
مع ذلك، لا يزحف Googlebot إلى جميع الصفحات التي اكتشفها، إذ قد يكون مالك الموقع الإلكتروني قد حظر الزحف إلى بعض الصفحات، فيما قد تكون صفحات أخرى غير متاحة بدون تسجيل الدخول إلى الموقع الإلكتروني.
خلال عملية الزحف، يعرض محرّك بحث Google الصفحة ويشغّل أي محتوى JavaScript يعثر عليه باستخدام إصدار حديث من Chrome، بالطريقة نفسها التي يتّبعها متصفحك لعرض الصفحات التي تزورها. تُعدّ عملية العرض مهمة لأنّ المواقع الإلكترونية غالبًا ما تعتمد على JavaScript لجلب المحتوى إلى الصفحة، وفي غياب عملية العرض، قد لا يكتشف محرّك بحث Google ذلك المحتوى.
تعتمد عملية الزحف على ما إذا كان بإمكان برامج زحف Google الوصول إلى الموقع الإلكتروني. وتشمل بعض المشاكل الشائعة التي تتعلّق بإمكانية وصول Googlebot إلى المواقع الإلكترونية ما يلي:
- مشاكل في الخادم الذي يستضيف الموقع الإلكتروني
- مشاكل في الشبكة
- قواعد robots.txt التي تمنع Googlebot من الوصول إلى الصفحة
الفهرسة
بعد أن يتم الزحف إلى الصفحة، يحاول محرّك بحث Google فهم مضمونها. تُعرف هذه المرحلة بالفهرسة وتشمل معالجة وتحليل المحتوى النصي والعلامات والسمات الرئيسية للمحتوى، مثل عناصر <title>
وسمات النص البديل والصور والفيديوهات وغير ذلك.
خلال عملية الفهرسة، يحدّد محرّك بحث Google ما إذا كانت الصفحة نسخة مكررة من صفحة أخرى على الإنترنت أو صفحة أساسية. الصفحة الأساسية هي الصفحة التي قد يتم عرضها في نتائج البحث. لاختيار الصفحة الأساسية، نجمّع أولاً الصفحات التي نعثر عليها على الإنترنت والتي تتضمن محتوًى مماثلاً (وهو ما يُعرف باسم التجميع)، ثم نختار الصفحة التي نعتقد أنّها الأكثر تمثيلاً في المجموعة. وتكون الصفحات الأخرى في المجموعة نُسخًا بديلة قد يتم عرضها في سياقات مختلفة، مثلاً عندما يُجري أحد المستخدمين عملية بحث من جهاز جوّال أو عندما يبحث عن صفحة معيّنة من هذه المجموعة.
يجمع محرّك بحث Google أيضًا إشارات عن الصفحة الأساسية والمحتوى المضمَّن عليها والذي يمكن استخدامه في المرحلة التالية، حين نعرض الصفحة في نتائج البحث. وتشمل بعض الإشارات لغة الصفحة والبلد المصدر للمحتوى وسهولة استخدام الصفحة.
قد تُحفَظ المعلومات التي يتم جمعها عن الصفحة الأساسية ومجموعة الصفحات المشابهة لها في فهرس Google، وهو قاعدة بيانات ضخمة مستضافة على الآلاف من أجهزة الكمبيوتر. لا يضمن محرّك بحث Google فهرسة كل الصفحات التي تتم معالجتها.
تعتمد عملية الفهرسة أيضًا على محتوى الصفحة والبيانات الوصفية الخاصة بها. ويمكن أن تشمل بعض المشاكل الشائعة للفهرسة ما يلي:
- جودة المحتوى على الصفحة منخفضة
-
قواعد
meta
الخاصة ببرامج Robots تمنع الفهرسة - تصميم الموقع الإلكتروني قد يتسبب في صعوبة عملية الفهرسة
عرض نتائج البحث
عندما يُجري المستخدم عملية بحث، تبحث محرّكاتنا في الفهرس عن الصفحات المطابقة وتعرض له النتائج التي نعتبرها الأعلى جودة والأكثر صلةً بموضوع البحث. ويتم تحديد مدى الصلة بموضوع البحث استنادًا إلى المئات من العوامل التي قد تشمل معلومات مثل موقع المستخدم الجغرافي ولغته والجهاز الذي يستخدمه (كمبيوتر مكتبي أو هاتف). على سبيل المثال، عند البحث عن "محلات إصلاح الدرّاجات"، ستختلف النتائج التي تظهر لمستخدم مقيم في دبي عن النتائج التي تظهر لمستخدم مقيم في بيروت.
استنادًا إلى طلب بحث المستخدم، تتغيّر أيضًا ميزات البحث التي تظهر على صفحة نتائج البحث. على سبيل المثال، عند البحث عن "محلات إصلاح الدرّاجات"، قد نعرض على الأرجح نتائج محلية بدون نتائج من البحث بالصور. في المقابل، يزيد احتمال عرض نتائج من البحث بالصور بدلاً من نتائج محلية استجابةً لطلب بحث عن "درّاجات حديثة" مثلاً. يمكنك الاطّلاع على عناصر واجهة المستخدم الأكثر شيوعًا على بحث الويب من Google في معرض العناصر المرئية.
يمكن أن تُبيّن لك خدمة Search Console أنّ الصفحة قد تمت فهرستها، ولكنها لا تظهر في نتائج البحث. قد يعود السبب في ذلك إلى أحد الأسباب التالية:
- المحتوى على الصفحة ليس ذا صلة بطلبات بحث المستخدمين
- جودة المحتوى منخفضة
-
قواعد
meta
الخاصة ببرامج Robots تمنع العرض
علمًا أنّ هذا الدليل يشرح طريقة عمل "بحث Google"، فنحن نعمل باستمرار على تحسين خوارزمياتنا. يمكنك تتبّع هذه التغييرات من خلال متابعة مدونة مجموعة خدمات بحث Google.