Googlebot y los 15 MB

Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Martes 28 de junio de 2022

En los últimos días, recibimos muchas preguntas sobre una actualización reciente de nuestra documentación sobre Googlebot. Concretamente, registramos que Googlebot solo "ve" los primeros 15 megabytes (MB) cuando recupera determinados tipos de archivos. Este umbral no es nuevo, ya que existe desde hace muchos años. Acabamos de agregarlo a nuestra documentación porque podría ser útil para algunas personas cuando se realiza la depuración y porque rara vez cambia.

Este límite solo se aplica a los bytes (contenido) que se reciben para la solicitud inicial que hace Googlebot, no a los recursos a los que se hace referencia en la página. Por ejemplo, cuando abres https://example.com/puppies.html, el navegador primero descarga los bytes del archivo HTML y, en función de esos bytes, es posible que haga más solicitudes de JavaScript externo, imágenes o cualquier otro tipo de contenido al que se hace referencia con una URL en HTML. Googlebot hace lo mismo.

¿Qué implica este límite de 15 MB para el usuario?
Probablemente, nada. Hay muy pocas páginas en Internet que sean de mayor tamaño. Es poco probable que te conviertas en el propietario de uno de ellas, ya que el tamaño promedio de un archivo HTML es alrededor de 500 veces más pequeño: 30 kilobytes (KB). Sin embargo, si eres el propietario de una página HTML que supera los 15 MB, te sugerimos que muevas al menos algunas secuencias de comandos intercaladas y CSS a archivos externos.

¿Qué sucede con el contenido después de los 15 MB?
Googlebot descarta el contenido después de los primeros 15 MB y solo esos 15 MB se reenvían a la indexación.

¿A qué tipos de contenido se aplica el límite de 15 MB?
El límite de 15 MB se aplica a las recuperaciones que realiza Googlebot (en smartphones y computadoras) cuando se recuperan los tipos de archivos compatibles con la Búsqueda de Google.

¿Esto significa que Googlebot no ve mis imágenes ni videos?
No, Googlebot recupera los videos y las imágenes a los que se hace referencia en el código HTML con una URL (por ejemplo, <img src="https://example.com/images/puppy.jpg" alt="cute puppy looking very disappointed" /> y las recuperaciones consecutivas).

¿Los URIs de datos se consideran en el tamaño del archivo HTML?
Sí, el uso de data URIs contribuirá al tamaño del archivo HTML, ya que se encuentra en el archivo HTML.

¿Cómo puedo saber el tamaño de una página?
Existen varias formas, pero la más fácil es usar tu propio navegador y sus herramientas para desarrolladores. Carga la página como lo harías normalmente, luego, abre las Herramientas para desarrolladores y cambia a la pestaña Network. Vuelve a cargar la página. Deberías ver todas las solicitudes que realizó tu navegador para procesar la página. Consulta la solicitud más grande. En ella, se informa el tamaño en bytes de la página en la columna Size.

Por ejemplo, en las herramientas para desarrolladores de Chrome, podría verse de la siguiente forma, con 150 KB en la columna Size:

La pestaña Network en las herramientas para desarrolladores de Chrome

Si te gusta tomar riesgos, puedes usar cURL desde una línea de comandos:

curl \
-A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \
-so /dev/null https://example.com/puppies.html -w '%{size_download}'

Si tienes más preguntas, puedes encontrarnos en Twitter y en los Foros de la Central de la Búsqueda. Si necesitas más información sobre nuestra documentación, déjanos tus comentarios en las mismas páginas.