El robot de Google y los 15 MB

Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Martes, 28 de junio del 2022

En los últimos días, hemos recibido muchas preguntas sobre una actualización reciente de nuestra documentación sobre el robot de Google. En concreto, hemos documentado que el robot de Google solo "ve" los primeros 15 megabytes (MB) al obtener determinados tipos de archivo. Este umbral no es nuevo, ya que existe desde hace muchos años. Lo hemos añadido a nuestra documentación porque puede ser útil para algunos usuarios a la hora de depurar, y porque rara vez cambia.

Este límite solo se aplica a los bytes (contenido) que se reciben para la solicitud inicial que hace el robot de Google, y no a los recursos a los que se hace referencia en la página. Por ejemplo, cuando abres https://example.com/puppies.html, tu navegador descarga inicialmente los bytes del archivo HTML y, a partir de ellos, puede enviar más solicitudes de JavaScript, imágenes o cualquier otro elemento externo con una URL en el código HTML. El robot de Google hace lo mismo.

¿Cómo me afecta este límite de 15 MB?
Lo más probable es que no te afecte. Hay muy pocas páginas de Internet que tienen un tamaño mayor. Es poco probable que te conviertas en el propietario de una de ellas, ya que el tamaño promedio de un archivo HTML es alrededor de 500 veces más pequeño: 30 kilobytes (KB). Sin embargo, si eres el propietario de una página HTML de más de 15 MB, es posible que tengas que mover algunas secuencias de comandos y código CSS a archivos externos.

¿Qué ocurre con el contenido después de los 15 MB?
El robot de Google descarta el contenido de después de los primeros 15 MB, y solo se reenvían esos 15 MB para que se indexen.

¿A qué tipos de contenido se aplica el límite de 15 MB?
El límite de 15 MB se aplica a las operaciones de obtención que hace el robot de Google (en smartphones y ordenadores) cuando se obtienen tipos de archivo compatibles con la Búsqueda de Google.

¿Quiere decir que el robot de Google no ve mi imagen o mi vídeo?
No. El robot de Google obtiene las imágenes y los vídeos a los que se hace referencia en el código HTML con una URL (por ejemplo, <img src="https://example.com/images/puppy.jpg" alt="cute puppy looking very disappointed" /> y obtenciones de datos consecutivas).

¿Los URIs de datos contribuyen al tamaño del archivo HTML?
Sí. Usar data URIs contribuye al tamaño del archivo HTML, ya que están en el archivo HTML.

¿Cómo puedo saber cuál es el tamaño de una página?
Hay varias formas, pero la más sencilla probablemente sea usar tu propio navegador y sus herramientas para desarrolladores. Carga la página como lo harías normalmente, abre las herramientas para desarrolladores y ve a la pestaña Network (Red). Si vuelves a cargar la página, deberían aparecer todas las solicitudes que ha hecho tu navegador para renderizarla. Consulta la solicitud más grande. En ella, se muestra el tamaño en bytes de la página en la columna Size (Tamaño).

Por ejemplo, si usas las herramientas para desarrolladores de Chrome, podría verse de la siguiente forma: 150 kB en la columna Size (Tamaño):

Pestaña Network (Red) en las herramientas para desarrolladores de Chrome

Si te atreves, puedes usar cURL desde una línea de comandos:

curl \
-A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \
-so /dev/null https://example.com/puppies.html -w '%{size_download}'

Si tienes más preguntas, nos puedes encontrar en Twitter y en los foros del Centro de la Búsqueda. Si necesitas más información sobre nuestra documentación, déjanos tus comentarios en las mismas páginas.