تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
الثلاثاء 28 حزيران (يونيو) 2022
لقد تلقيّنا عددًا كبيرًا من الأسئلة خلال الأيام الماضية بشأن تعديل حديث أجريناه في المحتوى المتعلّق ببرنامج Googlebot.
وعلى وجه التحديد، ذكرنا أنّ Googlebot "يرى" فقط أول 15
ميغابايت (MB)
عند جلب
أنواع معيّنة من الملفات.
يُرجى العِلم بأنّ هذا الحدّ ليس جديدًا، بل هو قائم منذ عدّة سنوات. ولم نجرِ أي تغيير عليه، إنما أضفنا المعلومات المتعلقة به إلى المستندات، لأنّها قد تكون مفيدة لبعض المستخدمين عند تصحيح الأخطاء ولأنّها نادرًا ما تتغيّر.
يُطبّق هذا الحدّ فقط على وحدات البايت (المحتوى) التي نتلقّاها للطلب الأول الذي يجريه Googlebot، وليس على الموارد المُشار إليها في الصفحة.
على سبيل المثال، عندما تفتح https://example.com/puppies.html، سينزّل المتصفّح أولاً وحدات البايت الخاصة بملف HTML، وبناءً على تلك الوحدات، يقرّر ما إذا كان سيجري
طلبات إضافية لملفات JavaScript أو صور خارجية أو أي موارد أخرى مُشار إليها من خلال عنوان URL في ملف HTML.
ويتّبع Googlebot الإجراء نفسه.
كيف يؤثّر هذا الحدّ البالغ 15 ميغابايت في صفحاتي؟
من المرجّح ألا يؤثّر ذلك في صفحاتك. هناك
عدد قليل جدًا من الصفحات
على الإنترنت التي تتجاوز هذا الحجم. ومن غير المحتمل أن تكون أنت مالك لإحدى هذه الصفحات، لأنّ متوسّط حجم ملف HTML هو أصغر من هذا الحدّ بنحو 500 مرة، أي ما يساوي 30 كيلوبايت.
في المقابل، إذا كنت مالكًا لصفحة HTML يتجاوز حجمها 15 ميغابايت، نطلب منك بلطف نقل
بعض النصوص البرمجية المضمّنة وموارد CSS إلى ملفات خارجية.
ماذا يحدث إلى المحتوى الذي يأتي بعد الحدّ البالغ 15 ميغابايت؟
يتجاهل Googlebot المحتوى الذي يأتي بعد أول 15 ميغابايت، ويعيد توجيه هذا الجزء الأول فقط من المحتوى لتتم فهرسته.
ما هي أنواع المحتوى الذي ينطبق عليه الحدّ البالغ 15 ميغابايت؟
ينطبق الحدّ البالغ 15 ميغابايت على عمليات الجلب التي ينفذّها Googlebot (سواء Googlebot للهواتف الذكية أم Googlebot للكمبيوتر المكتبي) عند جلب
أنواع الملفات المتوافقة مع "بحث Google".
هل هذا يعني أنّ Googlebot لا يرى الصور والفيديوهات الخاصة بي؟
لا، لأنّ Googlebot يجلب الفيديوهات والصور المُشار إليها في ملف HTML من خلال عنوان URL (على سبيل المثال، <img src="https://example.com/images/puppy.jpg" alt="cute puppy looking very disappointed" />
بشكل منفصل مع عمليات الجلب المتتالية).
هل تؤدّي معرّفات URI الخاصة بالبيانات إلى زيادة حجم ملف HTML؟
نعم. يساهم استخدام
data URIs
في زيادة حجم ملف HTML، لأنّها هذه المعرّفات تكون في الملف.
كيف يمكنني الاطّلاع على حجم صفحة معيّنة؟
هناك عدّة طرق للاطّلاع على حجم الصفحة، ولكن الطريقة الأسهل هي على الأرجح استخدام متصفّحك وأدوات المطوّرين التي يوفّرها. حمِّل الصفحة كالعادة، ثم افتح أدوات المطوّرين وانتقِل إلى
علامة التبويب "الشبكة". أعِد تحميل الصفحة، ومن المفترض أن تظهر جميع الطلبات التي أرسلها متصفّحك
لعرض الصفحة. ويكون الطلب الأول هو الذي يجب الاطّلاع عليه، حيث يظهر عدد وحدات البايت الخاصة بالصفحة
في عمود "الحجم".
على سبيل المثال، في
أدوات مطوّري برامج Chrome،
قد يظهر حجم الصفحة على النحو التالي، مع القيمة 150 كيلوبايت في عمود "الحجم":
curl \
-A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \
-so /dev/null https://example.com/puppies.html -w '%{size_download}'
إذا كانت لديك أي أسئلة إضافية، يمكنك التواصل معنا على
Twitter وفي
منتديات "مجموعة خدمات بحث Google".
وإذا كنت بحاجة إلى مزيد من التوضيح بشأن مستنداتنا، يمكنك إرسال ملاحظات إلينا على الصفحات
المعنيّة.
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],[],[[["\u003cp\u003eGooglebot has a 15MB size limit for processing the initial HTML content of a webpage, although it fetches referenced resources like images and videos separately.\u003c/p\u003e\n"],["\u003cp\u003eThis limit has been in effect for a long time but was recently documented to help web developers with debugging.\u003c/p\u003e\n"],["\u003cp\u003eContent exceeding the 15MB limit is disregarded by Googlebot during indexing, impacting only a small percentage of webpages.\u003c/p\u003e\n"],["\u003cp\u003eWeb developers are encouraged to optimize large HTML files by moving inline scripts and CSS to external files.\u003c/p\u003e\n"],["\u003cp\u003eYou can use browser developer tools or command-line tools like cURL to check the size of your webpage.\u003c/p\u003e\n"]]],["Googlebot only indexes the first 15 MB of fetched content for specific file types, a limit that's long-standing but recently documented. This limit applies to the initial request's bytes, including subresources like CSS and JavaScript. Content exceeding 15 MB is dropped. Most web pages are significantly smaller than this threshold. Data URIs contribute to the file size. Users can check page sizes via browser developer tools or cURL. Googlebot accesses images and videos via URLs separately.\n"],null,["# Googlebot and the 15 MB thing\n\nTuesday, June 28, 2022\n\n\nOver the last few days we've received a great deal of questions about a recent update to\n[our documentation about Googlebot](/search/docs/crawling-indexing/googlebot).\nNamely, we've documented that Googlebot only ever \"sees\" the first 15\n[megabytes](https://en.wikipedia.org/wiki/Megabyte#-_-) (MB)\nwhen fetching\n[certain file types](/search/docs/crawling-indexing/indexable-file-types).\nThis threshold is not new; it's been around for many years. We just added it to our documentation\nbecause it might be helpful for some folks when debugging, and because it rarely ever changes.\n\n\nThis limit only applies to the\n[bytes](https://en.wikipedia.org/wiki/Byte#;)) (content)\nreceived for the initial request Googlebot makes, not the referenced resources within the page.\n| **March 16, 2023**: To further clarify, each individual subresource fetch (in particular CSS and JavaScript) is bound to the 15MB limit.\n\n\nFor example, when you open `https://example.com/puppies.html`, your browser will\ninitially download the bytes of the HTML file, and based on those bytes it might make further\nrequests for external JavaScript, images, or whatever else is referenced with a URL in the HTML.\nGooglebot does the same thing.\n\n\n**What does this 15 MB limit mean to me?** \n\nMost likely nothing. There are\n[very few pages](https://twitter.com/paulcalvano/status/1541402096897069056)\non the internet that are bigger in size. You, dear reader, are unlikely to be the owner of one,\nsince the\n[median size of a HTML file is about 500 times smaller](https://httparchive.org/reports/page-weight#bytesHtml):\n30 [kilobytes (kB)](https://en.m.wikipedia.org/wiki/Kilobyte).\nHowever, if you are the owner of an HTML page that's over 15 MB, perhaps you could at least move\nsome inline scripts and CSS dust to external files, pretty please.\n\n\n**What happens to the content after 15 MB?** \n\nThe content after the first 15 MB is dropped by Googlebot, and only the first 15 MB gets forwarded\nto indexing.\n\n\n**What content types does the 15 MB limit apply to?** \n\nThe 15 MB limit applies to fetches made by Googlebot (Googlebot Smartphone and Googlebot Desktop)\nwhen fetching\n[file types supported by Google Search](/search/docs/crawling-indexing/indexable-file-types).\n\n\n**Does this mean Googlebot doesn't see my image or video?** \n\nNo. Googlebot fetches videos and images that are referenced in the HTML with a URL (for example,\n`\u003cimg src=\"https://example.com/images/puppy.jpg\" alt=\"cute puppy looking very disappointed\" /\u003e`\nseparately with consecutive fetches.\n\n\n**Do data URIs add to the HTML file size?** \n\nYes. Using\n[data URIs](https://en.wikipedia.org/wiki/Data_URI_scheme)\nwill contribute to the HTML file size since they are in the HTML file.\n\n\n**How can I look up the size of a page?** \n\nThere are a number of ways, but the easiest is probably using your own browser and its Developer\nTools. Load the page as you normally would, then launch the Developer Tools and switch to the\nNetwork tab. Reload the page, and you should see all the requests your browser had to make to\nrender the page. The top request is what you're looking for, with the byte size of the page in\nthe Size column.\n\n\nFor example, in the\n[Chrome Developer Tools](https://developer.chrome.com/docs/devtools)\nmight look something like this, with 150 kB in the size column:\n\n\nIf you're more adventurous, you can use [cURL](https://curl.se/)\nfrom a command line: \n\n```\ncurl \\\n-A \"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36\" \\\n-so /dev/null https://example.com/puppies.html -w '%{size_download}'\n```\n\n\nIf you have more questions, you can find us on\n[Twitter](https://twitter.com/googlesearchc)\nand in the\n[Search Central Forums](https://support.google.com/webmasters/community),\nand if you need more clarification about our documentation, leave us feedback on the pages\nthemselves.\n\nPosted by [Gary Illyes](https://garyillyes.com/+)"]]