دليل متقدّم: آلية عمل "بحث Google"

لتصحيح الأخطاء واستباق سلوك "بحث Google" على موقعك الإلكتروني، يجب فهم آلية "بحث Google" في الزحف إلى المحتوى وفهرسته وعرضه.

الزحف

الزحف هو العملية التي من خلالها يزور Googlebot الصفحات الجديدة والمعدّلة لإضافتها إلى فهرس Google.

نحن نستخدم مجموعة ضخمة من أجهزة الكمبيوتر للبحث عن (أو "الزحف إلى") مليارات الصفحات على الويب وجلبها. ويُعرف البرنامج الذي يجلب الصفحات باسم Googlebot (وهو معروف أيضًا باسم برنامج روبوت أو برنامج تتبّع أو برنامج عنكبوت). يستخدم Googlebot عملية تعتمد على الخوارزميات لتحديد المواقع الإلكترونية التي يزحف إليها وعدد مرات الزحف وعدد الصفحات التي يجلبها من كل موقع إلكتروني.

تبدأ عملية زحف Google بقائمة من عناوين URL لصفحات الويب تم إنشاؤها من عمليات زحف سابقة ومعزّزة ببيانات من ملفّات Sitemap التي قدّمها مالكو المواقع الإلكترونية. وعندما يزور Googlebot إحدى الصفحات، يكتشف روابط مضمّنة في الصفحة ويضيفها إلى قائمة الصفحات التي سيزحف إليها. ويرصد Googlebot المواقع الإلكترونية الجديدة والتغييرات التي أُجريَت على المواقع الإلكترونية الحالية والروابط المعطّلة، ثم يستخدمها لتعديل "فهرس Google".

أثناء الزحف، يعرض محرّك البحث Google الصفحة باستخدام إصدار حديث من Chrome. وكجزء من عملية العرض، يتم تشغيل أي نصوص برمجية يكتشفها في الصفحة. إذا كان موقعك الإلكتروني يستخدم محتوًى تم إنشاؤه ديناميكيًا، تأكّد من اتّباع القواعد الأساسية لتحسين محرّكات البحث المستندة إلى JavaScript.

كيف يتعرّف محرّك البحث Google على الصفحات المطلوب عدم الزحف إليها؟

  • لن يزحف محرّك البحث Google إلى الصفحات التي تم حظر الوصول إليها باستخدام ملف robots.txt، ولكنه قد يفهرس هذه الصفحات إذا كانت هناك روابط تؤدي إليها مضمّنة في صفحة أخرى. ويستطيع محرّك البحث Google استنتاج محتوى الصفحة من خلال رابط يوجّه المستخدمين إليها وفهرسة الصفحة بدون تحليل محتواها.
  • لا يستطيع محرّك البحث Google الزحف إلى أي صفحات تتطلّب من زوّارها تسجيل الدخول. وبالتالي، سيتم منع الزحف إلى صفحة إذا كانت تتطلّب تسجيل الدخول أو إذا كانت محمية بأسلوب آخر من أساليب المصادقة.
  • يتم الزحف بمعدّل أقل إلى الصفحات التي سبق وتم الزحف إليها والتي تُعتبر نُسخًا مكرّرة من صفحة أخرى.

تحسين الزحف إلى صفحات موقعك الإلكتروني

يمكنك استخدام الأساليب التالية لمساعدة محرّك البحث Google على اكتشاف الصفحات المناسبة على موقعك الإلكتروني:

الفهرسة

يعالج Googlebot كل صفحة يزحف إليها بهدف فهم محتواها. ويشمل ذلك معالجة المحتوى النصي والعلامات والسمات الرئيسية للمحتوى، مثل علامات <title> وسمات النص البديل والصور والفيديوهات وغير ذلك. ويستطيع Googlebot معالجة عدّة أنواع من المحتوى ولكن ليس كلّها. على سبيل المثال، لا نستطيع معالجة محتوى بعض ملفات الوسائط المتعددة التفاعلية.

في مرحلةٍ ما بين الزحف والفهرسة، يحدّد محرّك البحث Google ما إذا كانت الصفحة أساسية أو نسخة مكرّرة من صفحة أخرى. وإذا تم اعتبار الصفحة نسخة مكرّرة، سيتم الزحف إليها بمعدّل أقل بكثير. يتم تجميع الصفحات المتشابهة معًا في مستند، وهو عبارة عن مجموعة مكوّنة من صفحة واحدة أو أكثر تتضمّن الصفحة الأساسية (الأكثر تمثيلاً للمجموعة) وأي نُسخ مكرّرة تم العثور عليها (والتي قد تكون عناوين URL بديلة للوصول إلى الصفحة نفسها أو إصدارًا بديلاً من الصفحة نفسها مخصصًا للأجهزة الجوّالة أو لأجهزة الكمبيوتر).

يُرجى العِلم بأنّ محرّك البحث Google لا يفهرس الصفحات التي تحتوي على توجيه noindex (ضمن العنوان أو إضافة علامة). ولكي يتمكّن محرّك البحث Google من الاستجابة لتوجيه عدم الفهرسة، يجب أن يتمكن من رؤيته، لأنه إذا تم حظر وصوله إلى الصفحة باستخدام ملف robots.txt أو صفحة تسجيل دخول أو جهاز آخر، من الممكن أن يفهرس محرّك البحث Google الصفحة حتى لو لم يزحف إليها.

تحسين فهرسة موقعك الإلكتروني

ثمة أساليب متعددة لتحسين قدرة محرّك البحث Google على التعرّف على محتوى صفحتك:

ما هو "المستند"؟

داخليًا، تصف Google الويب على أنه مجموعة هائلة من المستندات. ويمثّل كل مستند صفحة ويب واحدة أو أكثر. وتكون هذه الصفحات إما متطابقة أو متشابهة جدًا، ولكنها تتضمّن في الأساس المحتوى نفسه الذي يمكن الوصول إليه من خلال عناوين URL مختلفة. ويمكن أن تؤدي عناوين URL المختلفة في المستند إلى الصفحة نفسها بالضبط (على سبيل المثال، قد يعرض العنوانان example.com/dresses/summer/1234 وexample.com?product=1234 الصفحة نفسها)، أو إلى الصفحة نفسها مع تغييرات بسيطة كي تناسب المستخدمين على أجهزة مختلفة (على سبيل المثال، example.com/mypage لمستخدمي أجهزة كمبيوتر سطح المكتب وm.example.com/mypage لمستخدمي الأجهزة الجوّالة).

يختار محرّك البحث Google أحد عناوين URL في مستند ويعرّفه على أنه عنوان URL الأساسي. وعنوان URL الأساسي للمستند هو أكثر عنوان URL يزحف إليه محرّك البحث Google ويفهرسه. أما عناوين URL الأخرى، فتُعتبر نُسخًا مكرّرة أو عناوين بديلة، وقد يتم الزحف إليها من حين إلى آخر أو عرضها بناءً على طلب المستخدم. على سبيل المثال، إذا كان عنوان URL الأساسي لمستند ما هو عنوان URL للأجهزة الجوّالة، سيستمر محرّك البحث Google على الأرجح في عرض عنوان URL (البديل) المخصّص لأجهزة كمبيوتر سطح المكتب للمستخدمين الذين يجرون عمليات بحث على أجهزة كمبيوتر سطح المكتب.

تنسب معظم التقارير في Search Console البيانات إلى عنوان URL الأساسي للمستند. وتتيح بعض الأدوات (مثل أداة فحص عنوان URL) اختبار عناوين URL بديلة، ولكن من المفترض أن توفّر عملية فحص عنوان URL الأساسي معلومات حول عناوين URL البديلة أيضًا.

يمكنك إبلاغ Google بعنوان URL الذي تفضّل أن يكون أساسيًا، ولكن محرّك البحث Google قد يختار عنوانًا أساسيًا مختلفًا لأسباب عديدة.

إليك ملخّص عن المصطلحات وكيفية استخدامها في Search Console:

  • المستند: هو مجموعة من الصفحات المتشابهة. ويتضمّن عنوان URL أساسيًا، ويمكن أن يتضمّن عناوين URL بديلة إذا كان موقعك الإلكتروني يحتوي على صفحات مكرّرة. وقد تكون عناوين URL المضمّنة في المستند واردة من المؤسسة نفسها أو من مؤسسة مختلفة (النطاق الجذر "google" على سبيل المثال في www.google.com). يختار محرّك البحث Google أفضل عنوان URL لعرضه في نتائج البحث استنادًا إلى منصّة العرض المستخدمة (الجوّال/جهاز كمبيوتر سطح المكتب) أو لغة المستخدم أو الموقع الجغرافي وغيرها من المتغيرات. يكتشف محرّك البحث Google الصفحات ذات الصلة على موقعك الإلكتروني من خلال الزحف الأصلي أو من خلال الميزات التي يطبّقها الموقع الإلكتروني، مثل عمليات إعادة التوجيه أو علامات <link rel=alternate/canonical>. للإشارة إلى الصفحات ذات الصلة الواردة من المؤسسات الأخرى كصفحات بديلة، يجب ترميزها صراحةً على موقعك الإلكتروني (من خلال عمليات إعادة التوجيه أو علامات الروابط).
  • عنوان URL: هو عنوان URL المستخدَم للوصول إلى جزء معيّن من المحتوى على الموقع الإلكتروني.
  • الصفحة: هي صفحة ويب معيّنة يتم الوصول إليها عن طريق عنوان URL واحد أو أكثر. وقد تكون هناك إصدارات مختلفة من الصفحة استنادًا إلى منصّة المستخدم (جهاز جوّال أو جهاز كمبيوتر سطح المكتب أو جهاز لوحي وما إلى ذلك).
  • الإصدار: هو صيغة واحدة من الصفحة، ويتم تصنيفه عادةً على أنه مخصّص لـ "الأجهزة الجوّالة" و"أجهزة كمبيوتر سطح المكتب" وAMP (على الرغم من أن إصدار AMP يمكن أن يتضمّن إصدارات للأجهزة الجوّالة وأجهزة الكمبيوتر). يمكن أن يكون لكل إصدار عنوان URL مختلفًا (example.com في مقابل m.example.com) أو عنوان URL نفسه (إذا كان موقعك الإلكتروني يستخدم العرض الديناميكي أو تصميم الويب السريع الاستجابة، يمكن أن يعرض عنوان URL نفسه إصدارات مختلفة من الصفحة نفسها) وفقًا لتصميم موقعك الإلكتروني. لا تُعتبر صيغ اللغة نسخًا مختلفة، بل مستندات مختلفة.
  • الصفحة الأساسية أو عنوان URL الأساسي: هو عنوان URL الذي يعتبره محرّك البحث Google الأكثر تمثيلاً للمستند. ويزحف محرّك البحث Google دائمًا إلى عنوان URL هذا، ويزحف في بعض الأحيان إلى عناوين URL المكرّرة في المستند.
  • الصفحة البديلة/المكرّرة أو عنوان URL البديل/المكرّر: هو عنوان URL للمستند الذي قد يزحف إليه محرّك البحث Google في بعض الأحيان. ويعرض محرّك البحث Google أيضًا عناوين URL هذه إذا كانت مناسبة للمستخدم ومطابقة للطلب (على سبيل المثال، سيتم عرض عنوان URL بديل للطلبات التي يجريها المستخدمون على أجهزة كمبيوتر سطح المكتب بدلاً من عنوان URL الأساسي المخصّص للأجهزة الجوّالة).
  • الموقع: يُستخدم عادةً كمرادف للموقع الإلكتروني (مجموعة من صفحات الويب المرتبطة بمفهوم واحد)، ولكن يُستخدم أحيانًا للإشارة إلى موقع في Search Console، على الرغم من أنه يمكن في الواقع تعريف الموقع باعتباره جزءًا من موقع إلكتروني. ويمكن أن يشمل الموقع الإلكتروني نطاقات فرعية (ونطاقات إذا كانت صفحات AMP مرتبطة بشكل صحيح).

عرض نتائج البحث

عندما يجري المستخدم عملية بحث، تبحث محرّكاتنا في الفهرس عن الصفحات المطابقة وتعرض له النتائج التي نعتبرها الأكثر صلةً بموضوع البحث. ويتم تحديد مدى الصلة بموضوع البحث استنادًا إلى مئات العوامل، ونعمل دائمًا على تحسين الخوارزميات التي نستخدمها. ويأخذ محرّك البحث Google تجربة المستخدم بالاعتبار عند اختيار وترتيب نتائج البحث، لذا احرص على أن تكون صفحتك سريعة التحميل ومتوافقة مع الأجهزة الجوّالة.

تحسين عرض صفحاتك

ثمة طرق متعدّدة لتحسين طريقة محرّك البحث Google في عرض محتوى صفحتك:

  • إذا كانت النتائج المعروضة من موقعك الإلكتروني تستهدف مستخدمين في مناطق جغرافية محدّدة أو يتحدثون بلغات محدّدة، يمكنك إعلام Google بخياراتك المفضّلة.
  • احرص على أن تكون صفحات موقعك الإلكتروني سريعة التحميل ومتوافقة مع الأجهزة الجوّالة.
  • اتّبِع إرشادات مشرفي المواقع لتجنّب الأخطاء الشائعة وتحسين ترتيب موقعك الإلكتروني في نتائج البحث.
  • جرِّب تفعيل ميزات نتائج البحث على موقعك الإلكتروني، مثل بطاقات وصفات الطعام أو بطاقات المقالات.
  • استخدِم صفحات بتنسيق AMP لزيادة سرعة تحميلها على الأجهزة الجوّالة. وبعض صفحات AMP مؤهّلة أيضًا للاستفادة من ميزات إضافية في نتائج البحث، مثل منصة العرض بعناصر متغيرة الخاصة بأهم الأخبار.
  • نعمل بشكل متواصل على تحسين الخوارزميات التي تستخدمها Google، لذا ننصحك بالتركيز على اتّباع إرشاداتنا وإنشاء محتوى جيد وجديد ليلقى إعجاب المستخدمين، بدلاً من محاولة تخمين طريقة عمل الخوارزميات وتصميم صفحات موقعك الإلكتروني للتوافق مع طريقة عملها.