شرح عمليات إزالة عناوين URL، الجزء الأول: عناوين URL والأدلة
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
الثلاثاء 30 آذار (مارس) 2010
تتضمّن
شبكة الإنترنت الكثير من المحتوى في الوقت الحالي.
وقد تجِد في مرحلة معيّنة أنّك نشرت محتوًى على الإنترنت لم يكن من المفترَض نشره،
بما في ذلك أيّ منشور بطابع تحريضي على مدونتك تندم على مشاركته أو أيّ بيانات سرية
تم الإفصاح عنها بدون قصد. وفي الغالب، إنّ حذف المحتوى أو فرض قيود على إمكانية الوصول إليه يؤدّي إلى إزالته بشكل تلقائي من نتائج البحث بعد فترة من الزمن. أما إذا كنت في حاجة ملحّة لإزالة المحتوى غير المرغوب فيه الذي فهرسه محرّك بحث Google ولا تريد الانتظار حتى تتم إزالته بشكل تلقائي، فيمكنك استخدام أداة إزالة عناوين URL التي نوفّرها، وذلك لتسريع عملية إزالة المحتوى من نتائج البحث لدينا شرط أن يستوفي طلبك معايير محددة (سنناقشها أدناه).
نوفّر سلسلة من مشاركات المدونات تشرح كيفية إزالة مختلف أنواع المحتوى بنجاح وتعرض الأخطاء الشائعة التي يجب تفاديها. نتناول في هذه المشاركة الأولى بعض السيناريوهات الأساسية، مثل إزالة عنوان URL فردي، وإزالة دليل أو موقع إلكتروني بأكمله، واسترجاع محتوى سبق حذفه. ننصحك بشدة بالاطّلاع على مشاركتنا السابقة حول إدارة المعلومات المتوفرة عنك على الإنترنت.
إزالة عنوان URL فردي
بشكل عام، لكي يتم تنفيذ طلبات الإزالة التي تقدّمها، على مالك عناوين URL المعنيّة قبول تلك الطلبات سواء كنت أنت المالك أو شخص آخر. لإزالة عنوان URL فردي، يمكن استخدام أي من الطرق الثلاث التالية:
علامة meta الخاصة بـ noindex: يمكنك استخدام أداة "جلب مثل Googlebot" للتأكد من ظهور علامة meta بين علامتَي <head> و</head>. إذا كنت
تريد التحقّق من صفحة لا يمكنك إثبات ملكيتها في أدوات مشرفي المواقع، يمكنك فتح عنوان URL في متصفح والانتقال إلى
عرض > مصدر الصفحة، والتأكد من ظهور
علامة meta بين علامتَي <head> و</head>.
رمزا الحالة 404 و410: يمكنك استخدام أداة "جلب مثل Googlebot" أو أدوات مثل Live HTTP Headers أو web-sniffer.net للتأكد من أنّ عنوان URL يعرض الرمز الصحيح. أحيانًا،
تظهر رسالة "404" أو "لم يتم العثور على الصفحة" في الصفحات المحذوفة، ولكنّها في الواقع تعرض
رمز حالة 200 في عنوان الصفحة، لذا ننصح باستخدام أداة مناسبة لفحص
عناوين الصفحات لإعادة التحقق.
إذا تم حذف المحتوى غير المرغوب فيه من الصفحة بدون حظرها بأي من الطرق السابقة، لن تتمكن من إزالة عنوان URL نهائيًا من نتائج البحث الخاصة بنا.
يتكرر هذا الأمر كثيرًا إذا لم تكن تملك الموقع الإلكتروني الذي يستضيف ذلك المحتوى. سنشرح ما يجب فعله عند حدوث هذه الحالة من خلال مشاركة لاحقة بعنوان الجزء الثاني من سلسلة إزالة عناوين URL.
إذا استوفى عنوان URL أحد المعايير السابقة، يمكنك إزالته بالانتقال إلى أداة الإزالة، وإدخال عنوان URL الذي تريد إزالته واختيار "سبق أن حظر مشرف الموقع هذه الصفحة". تأكَّد من إدخال عنوان URL المؤدي إلى موضع استضافة المحتوى، وليس عنوان URL الخاص بنتائج البحث من Google التي تعرض المحتوى. على سبيل المثال، أدخِل https://www.example.com/embarrassing-stuff.htmlوليسhttps://www.google.com/search?q=embarrassing+stuff.
للحصول على مزيد من التفاصيل التي تساعدك في التأكد من إدخالك لعنوان URL الصحيح، يمكنك الانتقال إلى مقالة مركز المساعدة الخاصة بنا. احرص على إدخال عنوان URL المعنيّ بدقة، وإلا لن نتمكّن من إزالة المحتوى غير المرغوب فيه الذي تريد حذفه.
حذف دليل أو موقع إلكتروني كامل
لإتمام عملية الإزالة على مستوى الدليل أو الموقع الإلكتروني بأكمله، يجب حظر الدليل أو الموقع الإلكتروني في ملف robots.txt الخاص بالموقع الإلكتروني. على سبيل المثال، لإزالة دليل https://www.example.com/secret/، يجب أن يتضمن ملف robots.txt ما يلي:
User-agent: *
Disallow: /secret/
لا يكفي فقط أن يعرض جذر الدليل رمز الحالة 404، لأنّ الدليل يمكنه إظهار رمز الحالة 404 مع استمرار عرض الملفات المتوفّرة ضمنه.
إنّ استخدام ملف robots.txt لحظر دليل (أو موقع إلكتروني بأكمله) يضمن أيضًا حظر جميع عناوين URL ضمن ذلك الدليل (أو الموقع الإلكتروني). يمكنك التأكد من إتمام عملية حظر الدليل على نحو صحيح باستخدام أداة جلب مثل Googlebot أو اختبار ملف robots.txt ضمن أدوات مشرفي المواقع.
لا يمكن لأحد غير المالكين المعتمَدين للمواقع الإلكترونية طلب إزالة دليل أو موقع إلكتروني كامل في أدوات مشرفي المواقع. لطلب إزالة دليل أو موقع إلكتروني، انقر على الموقع الإلكتروني المعنيّ، ثم انتقِل إلى تصميم الموقع الإلكتروني > وصول الزاحف إلى صفحات الموقع > إزالة عنوان URL. إذا أدخلت جذر الموقع الإلكتروني على أنّه عنوان URL الذي تريد إزالته، سيُطلب منك تأكيد أنّك تريد إزالة الموقع الإلكتروني بأكمله. إذا أدخلت دليلاً فرعيًا، اختَر "إزالة الدليل" من القائمة المنسدلة.
إعادة تضمين المحتوى
يمكنك في أي وقت إلغاء طلبات إزالة أي موقع إلكتروني تملكه، بما في ذلك أي طلبات أرسلها آخرون. لتنفيذ ذلك، يجب أن تكون مالكًا معتمدًا لهذا الموقع الإلكتروني في أدوات مشرفي المواقع. بعد إثبات ملكيتك للموقع الإلكتروني، يمكنك الانتقال إلى
تصميم الموقع الإلكتروني >
وصول الزاحف إلى صفحات الموقع >
إزالة عنوان URL >
عناوين URL التي تمت إزالتها (أو > طلبات الإزالة المقدَّمة من مشرفي المواقع الآخرين) والنقر على
"إلغاء" بجانب الطلبات التي تريد إلغاءها.
هل ما زالت لديك أسئلة؟ يمكنك متابعتنا لأنّنا سننشر المزيد من مشاركات السلسلة التي نتناول من خلالها كيفية إزالة المحتوى من نتائج البحث على Google. وإذا لم يكن بوسعك الانتظار، يمكنك الانتقال إلى منتدى المساعدة للاطّلاع على المزيد من المحتوى الذي شاركناه حول إزالة عناوين URL، وتحديد المشاكل الفردية وحلّها.
إذا ظلت لديك استفسارات بعد الاطّلاع على تجارب الآخرين، يمكنك طرحها علينا. يُرجى العِلم أنّه في معظم الأحيان، يتعذّر تقديم نصائح خاصة بعملية إزالة معيّنة بدون معرفة الموقع الإلكتروني أو عنوان URL المعنيّ. ننصح بمشاركة عنوان URL الخاص بك من خلال خدمة تقصير عنوان URL كي لا تتم فهرسة عنوان URL المقصود باعتباره جزءًا من مشاركتك، وستتيح لك بعض خدمات تقصير العناوين لاحقًا إمكانية إيقاف الرابط المختصَر بعد معالجة استفسارك.
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],[],[[["\u003cp\u003eGoogle's URL removal tool can expedite the removal of unwanted content from search results if specific criteria are met.\u003c/p\u003e\n"],["\u003cp\u003eContent removal requires indicating consent through methods like robots.txt, noindex meta tag, or returning a 404/410 status code.\u003c/p\u003e\n"],["\u003cp\u003eDirectory or site removal necessitates disallowing it in the robots.txt file and verification of site ownership in Google Webmaster Tools.\u003c/p\u003e\n"],["\u003cp\u003eVerified site owners can cancel removal requests and reinstate content through Google Webmaster Tools.\u003c/p\u003e\n"],["\u003cp\u003eThis blog post is part of a series further explaining content removal from Google search results, including cached content and third-party content.\u003c/p\u003e\n"]]],["To remove content from Google search results, owners must indicate it's okay to remove it by blocking it via `robots.txt`, `noindex` meta tag, or `404`/`410` status code. Use the URL removal tool to expedite removal if these criteria are met. Removing an entire directory/site requires blocking via `robots.txt`. Verified site owners can cancel removal requests in Webmaster Tools. Consult the help forum for more support, using a URL shortening service if sharing the URL.\n"],null,["# URL removal explained, Part I: URLs and directories\n\n| It's been a while since we published this blog post. Some of the information may be outdated (for example, some images may be missing, and some links may not work anymore).\n\nTuesday, March 30, 2010\n\n\nThere's\n[a lot of content on the Internet these days](https://googleblog.blogspot.com/2008/07/we-knew-web-was-big).\nAt some point, something may turn up online that you would rather not have out there---anything\nfrom an inflammatory blog post you regret publishing, to confidential data that accidentally got\nexposed. In most cases, deleting or restricting access to this content will cause it to naturally\ndrop out of search results after a while. However, if you urgently need to remove unwanted\ncontent that has gotten indexed by Google and you can't wait for it to naturally disappear, you\ncan use our URL removal tool to expedite the removal of content from our search results as long\nas it meets certain [criteria](/search/docs/crawling-indexing)\n(which we'll discuss below).\n\n\nWe've got a series of blog posts lined up for you explaining how to successfully remove various\ntypes of content, and common mistakes to avoid. In this first post, I'm going to cover a few basic\nscenarios: removing a single URL, removing an entire directory or site, and reincluding removed\ncontent. I also strongly recommend our previous post on\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\nRemoving a single URL\n---------------------\n\n\nIn general, in order for your removal requests to be successful, the owner of the URL(s) in\nquestion---whether that's you, or someone else---must have indicated that it's okay to\nremove that content. For an individual URL, this can be indicated in any of three ways:\n\n- block the page from crawling via a [robots.txt file](/search/docs/crawling-indexing/robots/intro)\n- block the page from indexing via a [`noindex` `meta` tag](/search/docs/crawling-indexing/block-indexing)\n- indicate that the page no longer exists by returning a [`404` or `410` status code](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes)\n\nBefore submitting a removal request, you can check whether the URL is correctly blocked:\n\n- **robots.txt:** You can check whether the URL is correctly disallowed using either the [Fetch as Googlebot](https://www.google.com/support/webmasters/bin/answer.py?answer=158587) or [Test robots.txt](https://www.google.com/support/webmasters/bin/answer.py?answer=156449) features in Webmaster Tools.\n- **`noindex` `meta` tag:** You can use Fetch as Googlebot to make sure the `meta` tag appears somewhere between the `\u003chead\u003e` and `\u003c/head\u003e` tags. If you want to check a page you can't verify in Webmaster Tools, you can open the URL in a browser, go to *View \\\u003e Page source* , and make sure you see the `meta` tag between the `\u003chead\u003e` and `\u003c/head\u003e` tags.\n- **`404` and `410` status code:** You can use Fetch as Googlebot, or tools like [Live HTTP Headers](https://addons.mozilla.org/en-US/firefox/addon/3829) or [web-sniffer.net](https://web-sniffer.net/) to verify whether the URL is actually returning the correct code. Sometimes \"deleted\" pages may *say* \"404\" or \"Not found\" on the page, but actually return a `200` status code in the page header; so it's good to use a proper header-checking tool to double-check.\n\n\nIf unwanted content has been removed from a page but the page hasn't been blocked in any of the\nabove ways, you will *not be able to completely remove that URL* from our search results.\nThis is most common when you don't own the site that's hosting that content. We cover what to do\nin this situation in a subsequent post in\n[Part II of our removals series](/search/blog/2010/04/url-removals-explained-part-ii-removing).\n\n\nIf a URL meets one of the above criteria, you can remove it by going to\n[the Removals Tool](https://www.google.com/webmasters/tools/removals),\nentering the URL that you want to remove, and selecting the \"Webmaster has already blocked the\npage\" option. Note that you should enter the URL where the content was hosted, *not* the URL\nof the Google search where it's appearing. For example, enter\n`https://www.example.com/embarrassing-stuff.html` *not*\n`https://www.google.com/search?q=embarrassing+stuff`.\n\n\n[Our help center article](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\nhas more details about making sure you're entering the proper URL. Remember that if you don't tell\nus the exact URL that's troubling you, we won't be able to remove the content you had in mind.\n\nRemoving an entire directory or site\n------------------------------------\n\n\nIn order for a directory or site-wide removal to be successful, the directory or site must be\n*disallowed in the site's\n[robots.txt file](/search/docs/crawling-indexing/robots/intro)* . For example, in order to\nremove the `https://www.example.com/secret/` directory,\nyour robots.txt file would need to include: \n\n```\nUser-agent: *\nDisallow: /secret/\n```\n\n\nIt isn't enough for the root of the directory to return a `404` status code,\nbecause it's possible for a directory to return a `404` but still serve out files underneath it.\nUsing robots.txt to block a directory (or an entire site) ensures that all the URLs under that\ndirectory (or site) are blocked as well. You can test whether a directory has been blocked\ncorrectly using either the\n[Fetch as Googlebot](https://www.google.com/support/webmasters/bin/answer.py?answer=158587)\nor\n[Test robots.txt](https://www.google.com/support/webmasters/bin/answer.py?answer=156449)\nfeatures in Webmaster Tools.\n\n\nOnly verified owners of a site can request removal of an entire site or directory in Webmaster\nTools. To request removal of a directory or site, click on the site in question, then go to\n*Site configuration \\\u003e\nCrawler access \\\u003e\nRemove URL*. If you enter the root of your site as the URL you want to remove, you'll be\nasked to confirm that you want to remove the entire site. If you enter a subdirectory, select the\n\"Remove directory\" option from the drop-down menu.\n\nReincluding content\n-------------------\n\n\nYou can cancel removal requests for any site you own at any time, including those submitted by\nother people. In order to do so, you must be a\n[verified owner of this site](https://www.google.com/support/webmasters/bin/topic.py?topic=8469)\nin Webmaster Tools. Once you've verified ownership, you can go to\n*Site configuration \\\u003e\nCrawler access \\\u003e\nRemove URL \\\u003e\nRemoved URLs* (or *\\\u003e Made by others*) and click\n\"Cancel\" next to any requests you wish to cancel.\n\n\nStill have questions? Stay tuned for the rest of our series on removing content from Google's\nsearch results. If you can't wait, much has already been written about URL removals, and\ntroubleshooting individual cases, in our\n[Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7&hl=en).\nIf you still have questions after reading others' experiences, you can ask. Note that, in most\ncases, it's hard to give relevant advice about a particular removal without knowing the site or\nURL in question. We recommend sharing your URL by using a\n[URL shortening service](https://www.google.com/search?q=url+shorteners)\nso that the URL you're concerned about doesn't get indexed as part of your post; some shortening\nservices will even let you disable the shortcut later on, once your question has been resolved.\n\nOther posts of this series\n--------------------------\n\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nFinally, you might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\nPosted by Susan Moskwa, Webmaster Trends Analyst"]]