مواصفات علامات meta
لبرامج Robots وdata-nosnippet
وX-Robots-Tag
يوضّح هذا المستند بالتفصيل طريقة استخدام الإعدادات على مستوى الصفحة والإعدادات على مستوى النص لضبط الطريقة التي يعرض بها محرّك بحث Google المحتوى الخاص بك ضمن نتائج البحث. يمكنك تحديد الإعدادات على مستوى الصفحة عن طريق تضمين علامة meta
على صفحات HTML أو في عنوان HTTP. ويمكنك تحديد الإعدادات على مستوى النص باستخدام السمة data-nosnippet
على عناصر HTML ضمن الصفحة.
تذكَّر أنّ هذه الإعدادات لا يمكن أن تتم قراءتها ومتابعتها إلا عند السماح لبرامج الزحف بالوصول إلى الصفحات التي تتضمّن هذه الإعدادات.
تسري قاعدة <meta name="robots" content="noindex">
على برامج الزحف في محرّك البحث. لحظر برامج الزحف المخصّصة لأغراض غير البحث، مثل AdsBot-Google
، قد تحتاج إلى إضافة قواعد تستهدف برنامج الزحف المحدّد (مثل <meta name="AdsBot-Google" content="noindex">
).
استخدام العلامة meta
لبرامج robots
تسمح لك العلامة meta
لبرامج robots باستخدام طريقة دقيقة على مستوى الصفحة للتحكّم في كيفية فهرسة صفحة فردية وعرضها للمستخدمين ضمن نتائج "بحث Google". ويمكنك وضع العلامة meta
لبرامج robots في القسم <head>
على صفحة محدّدة، على النحو التالي:
<!DOCTYPE html> <html><head> <meta name="robots" content="noindex"> (…) </head> <body>(…)</body> </html>
في هذا المثال، تطلب العلامة meta
لبرامج robots من محرّكات البحث عدم عرض الصفحة ضمن نتائج البحث. وتحدّد قيمة السمة name
(robots
) أنّ القاعدة ستُطبَّق على جميع برامج الزحف. إنّ السمتَين name
وcontent
غير حساستَين لحالة الأحرف. ولتوجيه الطلب إلى زاحف محدّد، يمكنك استبدال القيمة robots
للسمة name
بالرمز المميز لوكيل المستخدم الخاص بالزاحف المطلوب. يتيح محرّك بحث Google استخدام رمزين مميزين لوكيل المستخدم في العلامة meta
لبرامج robots، ويتم تجاهل القيم الأخرى:
-
googlebot
: لجميع النتائج النصيّة -
googlebot-news
: للنتائج الإخبارية
على سبيل المثال، للطلب من Google بشكل خاص عدم عرض صفحة ضمن نتائج البحث، يمكنك تحديد googlebot
كاسم العلامة meta
:
<meta name="googlebot" content="noindex">
لعرض صفحة في نتائج بحث الويب من Google، ولكن ليس في "أخبار Google"، يمكنك استخدام علامة googlebot-news
meta
التالية:
<meta name="googlebot-news" content="noindex">
لتحديد عدة برامج زحف بشكل فردي، استخدِم علامات meta
متعدّدة لبرامج robots على النحو التالي:
<meta name="googlebot" content="noindex"> <meta name="googlebot-news" content="nosnippet">
لحظر فهرسة الموارد التي ليست بتنسيق HTML، مثل ملفات PDF أو ملفات الفيديو أو الصور،
يمكنك استخدام عنوان الاستجابة X-Robots-Tag
بدلاً من ذلك.
استخدام عنوان HTTP X-Robots-Tag
يمكن استخدام X-Robots-Tag
كعنصر في استجابة عنوان HTTP لعنوان URL محدّد. وأي قاعدة صالحة للاستخدام في علامة meta
لبرامج robots يمكن أيضًا تحديدها باعتبارها X-Robots-Tag
. وفي ما يلي مثال
لاستجابة HTTP تتضمّن علامة X-Robots-Tag
تطلب من برامج الزحف عدم فهرسة صفحة معيّنة:
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noindex (…)
يمكنك دمج عدة عناوين X-Robots-Tag
في استجابة HTTP، أو يمكنك تحديد قائمة من القواعد مفصولة بفواصل. وفي ما يلي مثال على استجابة عنوان HTTP التي تتضمّن علامة X-Robots-Tag
noarchive
تم دمجها مع علامة unavailable_after
X-Robots-Tag
.
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)
قد تحدّد علامة X-Robots-Tag
وكيل مستخدم بشكل اختياري قبل القواعد. على سبيل المثال، يمكن استخدام المجموعة التالية من عناوين HTTP التي تتضمّن X-Robots-Tag
للسماح بعرض إحدى الصفحات في نتائج البحث الخاصة بمحرّكات بحث مختلفة بشكل مشروط:
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: googlebot: nofollow X-Robots-Tag: otherbot: noindex, nofollow (…)
تكون القواعد المحدّدة بدون وكيل مستخدم صالحة لجميع برامج الزحف. ويكون كل من عنوان HTTP واسم وكيل المستخدم والقيم المحدّدة غير حساسة لحالة الأحرف.
قواعد الفهرسة والعرض الصالحة
يمكن استخدام القواعد التالية، المتوفّرة أيضًا بتنسيق يمكن للآلة قراءته، للتحكّم في فهرسة وعرض مقتطف مع العلامة meta
لبرامج robots والعلامة X-Robots-Tag
. وتمثّل كل قيمة قاعدة محددة. يمكن دمج عدّة قواعد في قائمة مفصولة بفواصل أو في علامات meta
منفصلة. وهذه القواعد غير حساسة لحالة الأحرف.
القواعد | |
---|---|
|
لا تُفرض أي قيود على الفهرسة أو العرض. هذه القاعدة هي القيمة التلقائية وليس لها أي تأثير إذا تم إدراجها بشكل واضح. |
|
لا تعرض هذه الصفحة أو الوسائط أو المورد في نتائج البحث. إذا لم تحدّد هذه القاعدة، قد تتم فهرسة الصفحة أو الوسائط أو المورد وعرضها في نتائج البحث. لإزالة معلومات من Google، اتّبِع الدليل المفصّل. |
|
لا تتبع الروابط على هذه الصفحة. إذا لم تحدّد هذه القاعدة، قد يستخدم Google
الروابط على الصفحة لاكتشاف تلك الصفحات المرتبطة. اطّلِع على مزيد من المعلومات عن
nofollow .
|
|
هذا التوجيه مكافئ للسمة noindex, nofollow . |
|
لا تعرِض رابط نسخة مخبأة ضمن نتائج البحث. إذا لم تحدّد هذه القاعدة، قد ينشئ Google صفحة مخزّنة مؤقتًا وقد يتمكّن المستخدمون من الوصول إليها من خلال نتائج البحث. |
|
لا تعرض مربّع بحث ضمن رابط أقسام الموقع في نتائج البحث لهذه الصفحة. إذا لم تحدّد هذه القاعدة، قد ينشئ Google مربّع بحث خاصًا بموقعك الإلكتروني في نتائج البحث، بالإضافة إلى روابط مباشرة أخرى تؤدي إلى موقعك الإلكتروني. |
|
لا تعرِض مقتطفًا نصيًا أو معاينة فيديو في نتائج البحث لهذه الصفحة. قد تظلّ الصورة المصغّرة الثابتة (إذا توفّرت) مرئية إذا كانت تؤدي إلى تحسين تجربة المستخدم. ينطبق ذلك على جميع أشكال نتائج البحث (في "بحث الويب من Google" و"صور بحث Google" وميزة "اقتراحات" و"الملخّصات المستنِدة إلى الذكاء الاصطناعي")، وسيؤدي إلى منع استخدام المحتوى كإدخال مباشر في "الملخّصات المستنِدة إلى الذكاء الاصطناعي". إذا لم تحدّد هذه القاعدة، قد ينشئ Google مقتطفًا نصيًا ومعاينة فيديو استنادًا إلى المعلومات الواردة في الصفحة. إذا أردت استبعاد أقسام معيّنة من المحتوى في مقتطفات نتائج البحث، استخدِم
سمة HTML |
|
يُسمَح لمحرّك بحث Google بفهرسة محتوى صفحة إذا كان مضمّنًا في صفحة أخرى من خلال
لن يكون للقاعدة |
|
يمكنك إنشاء مقتطف نصي لنتيجة البحث هذه باستخدام [عدد] حرف كحد أقصى. (ملاحظة: قد يظهر عنوان URL في شكل عدّة نتائج بحث ضمن صفحة نتائج البحث.) ولا يؤثّر ذلك في معاينات الصور أو الفيديوهات. ينطبق ذلك على جميع أشكال نتائج البحث (مثل "بحث الويب من Google" و"صور بحث Google" وميزة "اقتراحات" و"مساعد Google" و"الملخّصات المستنِدة إلى الذكاء الاصطناعي")، وسيؤدي إلى الحدّ من مقدار المحتوى الذي يمكن أن يُستخدم كإدخال مباشر في "الملخّصات المستنِدة إلى الذكاء الاصطناعي". لا ينطبق هذا الحدّ على الحالات التي يمنح فيها الناشر إذنًا منفصلاً لاستخدام المحتوى. على سبيل المثال، إذا كان الناشر يقدّم محتوى في شكل بيانات منظَّمة في الصفحة أو أبرم اتفاقية ترخيص مع Google، لن تؤثر هذه الإعدادات في تلك الاستخدامات المسموح بها والمحدّدة بشكل أدقّ. يتم تجاهل هذه القاعدة في حال عدم تحديد [عدد] قابل للتحليل. إذا لم تحدّد هذه القاعدة، سيختار Google طول المقتطف. القيم الخاصة:
أمثلة: لمنع مقتطف من الظهور في نتائج البحث: <meta name="robots" content="max-snippet:0"> للسماح بعرض ما يصل إلى 20 حرفًا في المقتطف: <meta name="robots" content="max-snippet:20"> للإشارة إلى عدم وجود حدّ أقصى لعدد الأحرف التي يمكن عرضها في المقتطف: <meta name="robots" content="max-snippet:-1"> |
|
يمكنك تحديد الحد الأقصى لحجم معاينة الصورة لهذه الصفحة في نتائج البحث.
إذا لم تحدّد القاعدة القيم المقبولة في [الإعدادات]:
ينطبق ذلك على جميع أشكال نتائج البحث (مثل "بحث الويب من Google" و"صور بحث Google" وميزة "اقتراحات" و"مساعد Google"). ولا ينطبق هذا الحدّ على الحالات التي يمنح فيها الناشر إذنًا منفصلاً لاستخدام المحتوى. على سبيل المثال، إذا كان الناشر يقدّم محتوًى في شكل بيانات منظَّمة في الصفحة (مثل إصدار AMP والإصدارات الأساسية من مقالة) أو أبرم اتفاقية ترخيص مع Google، لن تؤثر هذه الإعدادات في تلك الاستخدامات المسموح بها والمحدّدة بشكل أدقّ.
إذا لم تكُن تريد أن يستخدم محرّك بحث Google الصور المصغّرة بحجم أكبر أثناء عرض صفحات AMP
والنسخة الأساسية من المقالة في "بحث Google" أو في ميزة "اقتراحات"، حدِّد
قيمة مثال: <meta name="robots" content="max-image-preview:standard"> |
|
بالنسبة إلى الفيديوهات على هذه الصفحة من نتائج البحث، استخدِم مقتطف فيديو لا يزيد عن [عدد] ثانية.
إذا لم تحدّد القاعدة القيم الخاصة:
ينطبق ذلك على جميع أشكال نتائج البحث (في "بحث الويب من Google" و"صور بحث Google" و"فيديو Google" وميزة "اقتراحات" و"مساعد Google"). يتم تجاهل هذه القاعدة في حال عدم تحديد [عدد] قابل للتحليل. مثال: <meta name="robots" content="max-video-preview:-1"> |
|
لا تعرِض ترجمة لهذه الصفحة في نتائج البحث. إذا لم تحدّد هذه القاعدة، قد يقدّم Google ترجمة لرابط العنوان والمقتطف الخاصَّين بنتيجة بحث للنتائج التي ليست بلغة طلب البحث. إذا نقر المستخدم على رابط العنوان المترجَم، سيتم إجراء أي تفاعل إضافي مع الصفحة من خلال خدمة "ترجمة Google" التي ستترجم تلقائيًا أي روابط يتم تتبّعها. |
|
لا تفهرس الصور على هذه الصفحة. إذا لم تحدّد هذه القيمة، قد تتم فهرسة الصور في الصفحة وعرضها في نتائج البحث. |
|
لا تعرِض هذه الصفحة في نتائج البحث بعد التاريخ/الوقت المحدّد. يجب تحديد التاريخ/الوقت بتنسيق متعارَف عليه، بما في ذلك على سبيل المثال لا الحصر RFC 822 وRFC 850 وISO 8601. يتم تجاهل القاعدة في حال عدم تحديد تاريخ/وقت صالح. حسب الإعدادات التلقائية، ما مِن تاريخ انتهاء صلاحية للمحتوى. إذا لم تحدّد هذه القاعدة، قد يتم عرض هذه الصفحة في نتائج البحث إلى أجل غير مسمى. سيعمل Googlebot على تخفيض معدل الزحف إلى عنوان URL بشكل كبير بعد التاريخ والوقت المحدّدَين. مثال: <meta name="robots" content="unavailable_after: 2020-09-21"> |
معالجة القواعد المدمَجة للفهرسة والعرض
يمكنك إنشاء تعليمات تضم عدّة قواعد، إما عن طريق دمج قواعد علامات meta
لبرامج robots باستخدام الفواصل، أو من خلال استخدام عدة علامات meta
. في ما يلي مثال لعلامة meta
لبرامج robots توجِّه برامج زحف الويب إلى عدم فهرسة الصفحة وإلى عدم الزحف إلى أي روابط في الصفحة:
قائمة مفصولة بفواصل
<meta name="robots" content="noindex, nofollow">
علامات meta
متعدّدة
<meta name="robots" content="noindex"> <meta name="robots" content="nofollow">
في ما يلي مثال يتضمن حدًّا أقصى للمقتطف النصي يبلغ 20 حرفًا ويسمح بعرض معاينة كبيرة للصورة:
<meta name="robots" content="max-snippet:20, max-image-preview:large">
بالنسبة إلى الحالات التي يتم فيها تحديد برامج زحف متعدّدة بالإضافة إلى قواعد مختلفة، سيستخدم محرّك البحث ناتج القواعد السلبية. مثلاً:
<meta name="robots" content="nofollow"> <meta name="googlebot" content="noindex">
عند زحف Googlebot إلى الصفحة التي تحتوي على علامات meta
هذه، سيعتبر أنّها تشمل قاعدة noindex, nofollow
.
استخدام سمة HTML data-nosnippet
يمكنك تحديد أجزاء نصية من صفحة HTML كي لا يتم استخدامها في المقتطف. ويمكن إجراء ذلك على مستوى عنصر HTML في حال توفّر سمة HTML data-nosnippet
للعناصر span
وdiv
وsection
. تُعدّ data-nosnippet
سمة منطقية.
وكما هي الحال مع جميع السمات المنطقية، يتم تجاهل أي قيمة محدّدة. ولضمان قدرة الآلة على قراءة المحتوى، يجب أن يكون قسم HTML بلغة HTML صالحة وأن يتم إغلاق جميع العلامات المناسبة وفقًا لذلك.
أمثلة:
<p>This text can be shown in a snippet <span data-nosnippet>and this part would not be shown</span>.</p> <div data-nosnippet>not in snippet</div> <div data-nosnippet="true">also not in snippet</div> <div data-nosnippet="false">also not in snippet</div> <!-- all values are ignored --> <div data-nosnippet>some text</html> <!-- unclosed "div" will include all content afterwards --> <mytag data-nosnippet>some text</mytag> <!-- NOT VALID: not a span, div, or section --> <p>This text can be shown in a snippet.</p> <div data-nosnippet> <p>However, this is not in snippet.</p> <ul> <li>Stuff not in snippet</li> <li>More stuff not in snippet</li> </ul> </div>
يعرض محرّك البحث Google عادةً الصفحات لفهرستها، ولكنّ عملية العرض غير مضمونة.
ولهذا السبب، قد يتم استخراج data-nosnippet
قبل العرض وبعده. ولضمان عرض الصفحات، يُرجى عدم إضافة السمة data-nosnippet
أو إزالتها من العُقَد الحالية في JavaScript.
عند إضافة عناصر DOM في JavaScript، يُرجى تضمين السمة data-nosnippet
بالشكل المناسب عند بدء إضافة العنصر إلى عناصر DOM الخاصة بالصفحة. وفي حال استخدام العناصر المخصّصة، عليك لفّها أو عرضها مع العناصر div
أو span
أو section
إذا كنت تحتاج إلى استخدام data-nosnippet
.
استخدام البيانات المنظَّمة
تتحكّم علامات meta
لبرامج Robots في مقدار المحتوى الذي يستخرجه Google تلقائيًا من صفحات الويب لعرضه ضمن نتائج البحث. يستخدم العديد من الناشرين أيضًا بيانات schema.org المنظَّمة لإتاحة معلومات محدّدة في نتائج البحث. ولا تؤثر قيود علامات meta
لبرامج Robots في استخدام تلك البيانات المنظَّمة، باستثناء القيمتَين article.description
وdescription
في البيانات المنظَّمة المخصّصة لأعمال إبداعية أخرى. لتحديد الحدّ الأقصى لطول معاينة ما بناءً على قيم description
هذه، يمكنك استخدام القاعدة max-snippet
. على سبيل المثال، تكون بيانات recipe
المنظَّمة على إحدى الصفحات صالحة للتضمين في لوحة عرض دوّارة لوصفات طعام، حتى إذا فُرضت قيود على معاينة النص. يمكنك تحديد طول معاينة نص باستخدام max-snippet
، ولكن لا تسري العلامة meta
هذه لبرامج robots عند توفير المعلومات باستخدام بيانات منظَّمة لنتائج غنية بصريًا.
لإدارة استخدام البيانات المنظَّمة على صفحات الويب، عليك تعديل أنواع البيانات المنظَّمة وقيمها وإضافة المعلومات أو إزالتها لتوفير البيانات التي تريد إتاحتها فقط. يُرجى العِلم أيضًا أنّ البيانات المنظَّمة تظل قابلة للاستخدام في نتائج البحث عند إدراجها ضمن عنصر data-nosnippet
.
التطبيق العملي للعلامة X-Robots-Tag
يمكنك إضافة العلامة X-Robots-Tag
إلى استجابات HTTP لموقع إلكتروني من خلال ملفات الإعداد على برنامج خادم الويب الخاص بموقعك الإلكتروني. على سبيل المثال، يمكنك استخدام ملفات .htaccess وhttpd.conf على خوادم الويب المستندة إلى Apache. وتتمثّل الفائدة من استخدام X-Robots-Tag
مع استجابات HTTP في أنّه يمكنك تحديد قواعد الزحف التي يتم تطبيقها بشكل شامل في موقع إلكتروني. وتوفّر
إتاحة التعبيرات العادية مستوًى عاليًا من المرونة.
على سبيل المثال، لإضافة X-Robots-Tag
noindex, nofollow
إلى استجابة HTTP لجميع الملفات بالامتداد .PDF
في جميع أقسام الموقع الإلكتروني، أضِف المقتطف التالي إلى ملف جذر الموقع الإلكتروني بالامتداد .htaccess
أو الملف بالامتداد httpd.conf
على Apache أو الملف بالامتداد .conf
الخاص بالموقع الإلكتروني على NGINX.
Apache
<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow" </Files>
NGINX
location ~* \.pdf$ { add_header X-Robots-Tag "noindex, nofollow"; }
يمكنك استخدام العلامة X-Robots-Tag
لملفات ليست بتنسيق HTML، مثل ملفات الصور التي لا يمكن فيها استخدام العلامات meta
لبرامج robots بتنسيق HTML. في ما يلي مثال على إضافة قاعدة X-Robots-Tag
noindex
لملفات الصور (.png
أو .jpeg
أو .jpg
أو .gif
) في جميع أقسام الموقع الإلكتروني:
Apache
<Files ~ "\.(png|jpe?g|gif)$"> Header set X-Robots-Tag "noindex" </Files>
NGINX
location ~* \.(png|jpe?g|gif)$ { add_header X-Robots-Tag "noindex"; }
يمكنك أيضًا ضبط عناوين X-Robots-Tag
للملفات الثابتة الفردية:
Apache
# the htaccess file must be placed in the directory of the matched file. <Files "unicorn.pdf"> Header set X-Robots-Tag "noindex, nofollow" </Files>
NGINX
location = /secrets/unicorn.pdf { add_header X-Robots-Tag "noindex, nofollow"; }
دمج قواعد robots.txt مع قواعد الفهرسة والعرض
يتم اكتشاف علامات meta
لبرامج robots وعناوين HTTP التي تتضمّن X-Robots-Tag
عندما يتم الزحف إلى عنوان URL. في حال منع الزحف إلى إحدى الصفحات من خلال ملف robots.txt، لن يتم العثور على أي معلومات عن قواعد الفهرسة أو العرض، وبالتالي سيتم تجاهلها. وإذا كان يجب اتّباع قواعد الفهرسة أو العرض، لا يمكن منع الزحف إلى عناوين URL التي تحتوي على هذه القواعد.