نظرة عامة على برامج الزحف وبرامج الجلب من Google (برامج وكيل المستخدم)
تستخدم Google برامج الزحف والجلب لتنفيذ الإجراءات الخاصة بمنتجاتها، سواءً بشكل تلقائي أو استنادًا إلى طلب المستخدم.
"الزاحف" (يُسمّى أيضًا "الروبوت" أو "العنكبوت") هو مصطلح عام لأي برنامج يتم استخدامه لاكتشاف المواقع الإلكترونية وفحصها تلقائيًا من خلال تتبُّع الروابط من صفحة ويب إلى أخرى. ويُطلق الاسم Googlebot على زاحف Google الرئيسي المستخدَم في "بحث Google".
أمّا برامج الجلب، فهي أدوات، مثل المتصفح، تطلب عنوان URL واحدًا عندما يطلب المستخدم ذلك.
تعرض الجداول التالية برامج الزحف والجلب من Google التي تستخدمها المنتجات والخدمات المختلفة، بالإضافة إلى كيفية رؤيتها في سجلّات المُحيل الخاصة بك، وكيفية تحديدها في ملف robots.txt. وهذه القوائم ليست شاملة، بل تتضمّن فقط برامج الزحف والجلب الأكثر شيوعًا والتي قد تظهر ضمن ملفات السجلّ.
-
يُستخدم الرمز المميّز لوكيل المستخدم في سطر
User-agent:
داخل ملف robots.txt بهدف المطابقة مع نوع من برامج الزحف عند كتابة قواعد الزحف الخاصة بموقعك الإلكتروني. بعض برامج الزحف لديها أكثر من رمز مميّز واحد على النحو الوارد في الجدول، وما عليك سوى مطابقة رمز مميّز واحد للزاحف ليتم تطبيق القاعدة. هذه القائمة ليست كاملة، ولكنها تشمل معظم برامج الزحف التي قد تعمل على موقعك الإلكتروني. - السلسلة الكاملة لوكيل المستخدم هي سلسلة تقدّم وصفًا كاملاً للزاحف وتظهر في طلب HTTP وسجلّات الويب الخاصة بك.
برامج الزحف الشائعة
تُستخدم برامج الزحف الشائعة من Google في إنشاء فهارس "بحث Google" وتنفيذ عمليات زحف أخرى خاصة بالمنتجات، ولأغراض التحليل. ودائمًا ما تتّبع هذه البرامج قواعد robots.txt وتزحف عمومًا من نطاقات عناوين IP المنشورة في كائن googlebot.json.
برامج الزحف الشائعة | |||||
---|---|---|---|---|---|
Googlebot Smartphone |
|
||||
Googlebot Desktop |
|
||||
Googlebot Image |
يُستخدم للزحف إلى وحدات البايت الخاصة بالصور في "صور بحث Google" والمنتجات المستندة إلى الصور.
|
||||
أخبار Googlebot |
يستخدم "أخبار Googlebot" برنامج Googlebot للزحف إلى المقالات الإخبارية، لكنّه يستجيب للرمز المميز التابع لوكيل المستخدم السابق
|
||||
Googlebot Video |
يُستخدم للزحف إلى وحدات البايت الخاصة بالفيديوهات في Google Video والمنتجات المستندة إلى الفيديوهات.
|
||||
Google StoreBot |
يزحف Google StoreBot إلى أنواع معيّنة من الصفحات، بما في ذلك على سبيل المثال لا الحصر، صفحات تفاصيل المنتجات وصفحات سلّات التسوق وصفحات الدفع.
|
||||
Google-InspectionTool |
Google-InspectionTool هو الزاحف الذي تستخدمه أدوات الاختبار في "بحث Google"، مثل اختبار النتائج الغنية بصريًا وفحص عنوان URL في Search Console. بالإضافة إلى وكيل المستخدم والرمز المميز لوكيل المستخدم، يحاكي هذا الزاحف أيضًا Googlebot.
|
||||
GoogleOther |
GoogleOther هو الزاحف العام الذي يمكن أن تستخدمه فِرق خاصة بمنتجات متعددة لجلب محتوى متاح للجميع من مواقع إلكترونية. على سبيل المثال، يمكن استخدامه للزحف مرة واحدة لإجراء عمليات تطوير وأبحاث داخلية.
|
||||
Google-Extended |
|
برامج الزحف ذات الحالات الخاصة
تُستخدم برامج الزحف ذات الحالات الخاصة في منتجات معيّنة إذا كانت هناك اتفاقية بين الموقع الإلكتروني الذي يتم الزحف إليه والمنتج بشأن عملية الزحف. على سبيل المثال، يتجاهل AdsBot
وكيل المستخدم العام robots.txt (*
) الحاصل على إذن ناشر الإعلان. يمكن أن تتجاهل برامج الزحف ذات الحالات الخاصة قواعد robots.txt، وبذلك تعمل من نطاق IP مختلف عن برامج الزحف الشائعة. ويتم نشر نطاقات IP في الكائن special-crawlers.json.
برامج الزحف ذات الحالات الخاصة | |||||
---|---|---|---|---|---|
APIs-Google |
تستخدمه أداة Google APIs لعرض رسائل الإشعارات الفورية. وهو يتجاهل وكيل المستخدم العام (
|
||||
AdsBot Mobile Web Android |
يفحص جودة الإعلانات على صفحات الويب في أجهزة Android.
وهو يتجاهل وكيل المستخدم العام (
|
||||
AdsBot Mobile Web |
يفحص جودة الإعلانات على صفحات الويب في هواتف iPhone.
وهو يتجاهل وكيل المستخدم العام (
|
||||
AdsBot |
يفحص جودة الإعلانات على صفحات الويب في أجهزة الكمبيوتر المكتبي.
وهو يتجاهل وكيل المستخدم العام (
|
||||
AdSense |
يزور زاحف AdSense موقعك الإلكتروني لتحديد محتواه بهدف تقديم إعلانات ملائمة. وهو يتجاهل وكيل المستخدم العام (
|
||||
Mobile AdSense |
يزور زاحف Mobile AdSense موقعك الإلكتروني لتحديد محتواه بهدف تقديم إعلانات ملائمة. وهو يتجاهل وكيل المستخدم العام (
|
||||
Google-Safety |
يتعامل وكيل المستخدم Google-Safety مع عمليات الزحف المتعلّقة بإساءة الاستخدام، مثل اكتشاف البرامج الضارة المرتبطة بالروابط المنشورة بشكل علني على خدمات Google. سيتجاهل وكيل المستخدم هذا قواعد robots.txt.
|
برامج الجلب التي يشغّلها المستخدم
الغرض من برامج الجلب التي يشغّلها المستخدم هو تنفيذ وظيفة خاصة بالمنتج. على سبيل المثال، تعالج أداة إثبات ملكية الموقع على Google طلب المستخدم. وتتجاهل عادةً برامج الجلب هذه قواعد robots.txt لأنّ المستخدم هو الذي طلب عملية الجلب. أمّا نطاقات IP التي تستخدمها برامج الجلب التي يشغّلها المستخدم، فيتم نشرها في الكائن user-triggered-fetchers.json.
برامج الجلب التي يشغّلها المستخدم | |||||
---|---|---|---|---|---|
Feedfetcher |
يُستخدم برنامج Feedfetcher للزحف إلى خلاصات RSS أو Atom على تطبيق "Google بودكاست" و"أخبار Google" وPubSubHubbub.
|
||||
"مركز الناشرين" في Google |
يجلب ويعالج الخلاصات التي يوفّرها الناشرون بشكل واضح من خلال "مركز الناشرين" ليتم استخدامها في الصفحات المقصودة في "أخبار Google".
|
||||
Google Read Aloud |
استنادًا إلى طلب المستخدم، يجلب Google Read Aloud صفحات الويب ويقرأها من خلال تقنية تحويل النص إلى كلام.
|
||||
أداة إثبات ملكية الموقع على Google |
استنادًا إلى طلب المستخدم، تجلب أداة "إثبات ملكية الموقع على Google" الرموز المميَّزة لإثبات ملكية النطاق في Search Console.
|
ملاحظة عن Chrome/W.X.Y.Z في برامج وكيل المستخدم
أينما ترِد سلسلة Chrome/W.X.Y.Z ضمن سلاسل برامج وكيل المستخدم في الجدول، تكون W.X.Y.Z عبارة عن عنصر نائب يمثّل إصدار متصفّح Chrome الذي يستخدمه وكيل المستخدم هذا، مثلاً، 41.0.2272.96
. سيزداد رقم الإصدار هذا بمرور الوقت ليطابق أحدث نسخة من إصدارات Chromium يستخدمها Googlebot.
إذا كنت تبحث في سجلّاتك أو تجري فلترة للخادم للعثور على وكيل مستخدم بهذا النمط، استخدِم أحرفَ بدلٍ لرقم الإصدار بدلاً من تحديد رقم إصدار معيّن.
برامج وكيل المستخدم في robots.txt
عندما يتم التعرّف على العديد من برامج وكيل المستخدم في ملف robots.txt، يتّبع محرّك بحث Google وكيل المستخدم الأكثر تحديدًا. إذا كنت تريد أن تزحف جميع برامج الزحف من Google إلى صفحاتك، لست بحاجة إلى استخدام ملف robots.txt على الإطلاق. إذا كنت تريد منع جميع برامج الزحف في Google من الدخول إلى محتوى معيّن أو السماح لها بهذا، يمكنك إجراء ذلك من خلال ضبط Googlebot على أنّه وكيل المستخدم. على سبيل المثال، إذا كنت تريد أن تظهر جميع صفحاتك في "بحث Google"، وإذا كنت تريد أن تظهر إعلانات AdSense على صفحاتك، لست بحاجة إلى ملف robots.txt. وإذا كنت تريد حظر بعض الصفحات من الظهور في "بحث Google" نهائيًا، سيؤدي حظر وكيل المستخدم Googlebot
أيضًا إلى حظر جميع برامج وكيل المستخدم الأخرى من Google.
إذا أردت التحكم بشكل أدقّ في المحتوى الذي سيظهر ضمن نتائج البحث، يمكنك استخدام قواعد أكثر تحديدًا. على سبيل المثال، قد تريد أن تظهر جميع صفحاتك في "بحث Google"، ولكن لا تريد أن يتم الزحف إلى الصور في دليلك الشخصي. في هذه الحالة، استخدِم ملف robots.txt لمنع وكيل المستخدم Googlebot-Image
من الزحف إلى الملفات في دليلك الشخصي (مع السماح لبرنامج Googlebot بالزحف إلى جميع الملفات)، على هذا النحو:
User-agent: Googlebot Disallow: User-agent: Googlebot-Image Disallow: /personal
كمثال آخر، لنفترض أنّك تريد نشر إعلانات على جميع صفحاتك، لكنّك لا تريد أن تظهر هذه الصفحات في "بحث Google". في هذه الحالة، يمكنك حظر Googlebot مع السماح بوكيل المستخدم Mediapartners-Google
، على هذا النحو:
User-agent: Googlebot Disallow: / User-agent: Mediapartners-Google Disallow:
التحكّم في سرعة الزحف
يدخل كل زاحف من Google إلى المواقع الإلكترونية لغرض محدّد وبمعدّلات زحف مختلفة. ويستخدم محرّك بحث Google الخوارزميات لتحديد معدّل الزحف المثالي لكل موقع إلكتروني. إذا كان زاحف Google يزحف إلى موقعك الإلكتروني بمعدّل مرتفع، يمكنك خفض معدّل الزحف.
برامج زحف من Google تمت إزالتها
إنّ برامج الزحف التالية من Google لم تعُد قيد الاستخدام ويتم ذكرها هنا لأغراض مرجعية فقط.
برامج زحف من Google تمت إزالتها | |||||
---|---|---|---|---|---|
Duplex على الويب |
كان وكيل المستخدم متوافقًا مع خدمة "Duplex على الويب".
|
||||
تقنيّة Web Light |
كان يتم التأكّد من توفّر عنوان
|
||||
Mobile Apps Android |
يفحص جودة الإعلانات على صفحات تطبيقات Android.
وهو يلتزم بقواعد
|
||||
Google Favicon |
|