Mitos y realidades sobre el rastreo
Pon a prueba tus conocimientos sobre cómo Google rastrea los sitios web.
Si se comprimen los sitemaps, se puede aumentar el presupuesto de rastreo.
Verdadero
Falso
No es cierto. Los sitemaps comprimidos también tienen que obtenerse del servidor, por lo que no ahorran mucho tiempo de rastreo ni trabajo.
Google prefiere el contenido actualizado, así que es mejor que no pare de modificar mis páginas.
Verdadero
Falso
En la Búsqueda de Google, el contenido se clasifica por calidad, independientemente de cuándo se haya publicado. Crea y actualiza tu contenido según sea necesario, pero ten en cuenta que no aporta ningún valor hacer cambios banales y actualizar la fecha de las páginas para que parezcan estar actualizadas.
Google prefiere el contenido antiguo al nuevo porque tiene más importancia.
Verdadero
Falso
Si tu página es útil, no importa si es nueva o antigua.
Google prefiere URLs claras y no le gustan los parámetros de consulta.
Verdadero
Falso
En Google podemos rastrear parámetros.
Cuanto más rápido se carguen y rendericen las páginas, más podrá rastrear Google.
Verdadero
Cierto: nuestros recursos están limitados por el tiempo y el número de robots de rastreo. Cuantas más páginas puedas publicar en un tiempo limitado, más se pueden rastrear. Sin embargo, es posible que se dedique más tiempo a rastrear un sitio que tenga información más importante, aunque sea más lento. Probablemente te interese más que tu sitio sea más rápido para los usuarios que para aumentar la cobertura de rastreo. Es mucho más sencillo ayudar a Google a rastrear el contenido adecuado que intentar que lo rastree todo cada vez. Ten en cuenta que el rastreo de un sitio implica la recuperación y el renderizado del contenido. El tiempo que se tarda en renderizar la página cuenta tanto como el tiempo que se tarda en solicitarla.
Por lo tanto, si las páginas se renderizan más rápido, también aumentará la velocidad de rastreo.
Falso
Los sitios pequeños no se rastrean tan a menudo como los grandes.
Verdadero
Falso
Si un sitio tiene contenido importante que cambia con frecuencia, se rastrea a menudo, independientemente de su tamaño.
Cuanto más cerca esté tu contenido de la página principal, más importante será para Google.
Verdadero
Verdadero, en parte
La página principal de un sitio suele ser la más importante, por lo que es posible que las páginas a las que se puede acceder directamente desde ella se consideren más importantes y, por tanto, se rastreen con más frecuencia. No obstante, eso no quiere decir que esas páginas vayan a aparecer en posiciones más altas en comparación con otras páginas de tu sitio.
Falso
Cambiar las versiones de las URLs es una buena forma de animar a Google a volver a rastrear mis páginas.
Verdadero
Verdadero, en parte
Si tus páginas tienen URLs con nuevas versiones, es probable que Google las rastree antes; sin embargo, no suele ser necesario y malgastarás recursos de rastreo si la página en realidad no cambia. Si recurres a URLs con versiones para indicar nuevo contenido, lo recomendable es que solo cambies la URL cuando hayas modificado considerablemente el contenido de la página.
Falso
La velocidad y los errores de un sitio afectan al presupuesto de rastreo.
Verdadero
Si un sitio es rápido, la experiencia de los usuarios es mejor y el sitio se rastrea con más frecuencia. Para los rastreadores de Google, si un sitio es rápido, sus servidores están en buen estado y, por tanto, pueden obtener más contenido con el mismo número de conexiones. En cambio, si hay muchos códigos de estado de respuesta HTTP
5xx (errores de servidor) o se agota el tiempo de espera de las conexiones, reducirá la frecuencia de rastreo. Lo recomendable es que prestes atención al informe "Estadísticas de rastreo" de Search Console y que reduzcas al máximo los errores de servidor.
Falso
El rastreo es un factor de posicionamiento en la Búsqueda de Google.
Verdadero
Falso
Por mucho que aumentes la frecuencia de rastreo, la posición de tu sitio en los resultados de la Búsqueda de Google no tiene por qué mejorar.
Google tiene en cuenta muchos factores a la hora de posicionar los resultados y, aunque es necesario rastrear una página para que aparezca en los resultados, el rastreo no es uno de ellos.
Las URLs alternativas y el contenido insertado consumen presupuesto de rastreo.
Verdadero
Por lo general, todas las URLs que rastrea el robot de Google gastan presupuesto de rastreo de un sitio.
Es posible que haya que rastrear URLs alternativas, como AMP o hreflang, y contenido insertado, como CSS y JavaScript, incluidas las obtenciones de XHR, lo que consume parte del presupuesto de rastreo.
Falso
Puedo controlar los rastreadores de Google con la regla "crawl-delay".
Verdadero
Falso
Los rastreadores de Google no procesan la regla "crawl-delay" no estándar del archivo robots.txt.
La regla
nofollow afecta al presupuesto de rastreo.Verdadero
Verdadero, en parte
Se gasta presupuesto de rastreo al rastrear cualquier URL, por lo que, aunque en una de tus páginas se marque una URL con la regla
nofollow, es posible que la URL se acabe rastreando si está enlazada en otra página del sitio o de Internet sin la regla nofollow.Falso
Puedo utilizar
noindex para controlar el presupuesto de rastreo.Verdadero
Verdadero, en parte
Todas las URLs que se rastrean afectan al presupuesto de rastreo, y Google debe rastrear la página para encontrar la regla
Sin embargo,
noindex.
Sin embargo,
noindex puede ayudarte a mantener las páginas fuera del índice. Si quieres asegurarte de que esas páginas no terminen en el índice de Google, continúa usando noindex y no te preocupes por el presupuesto de rastreo. También debes tener en cuenta que, si quitas URLs del índice de Google con noindex o con cualquier otro método, los rastreadores Google pueden centrarse en otras URLs de tu sitio, lo que significa que noindex puede liberar indirectamente parte del presupuesto de rastreo para tu sitio a largo plazo.
Falso
Las páginas que sirven códigos de estado HTTP
4xx desperdician el presupuesto de rastreo.Verdadero
Falso
Las páginas que sirven códigos de estado HTTP
4xx (excepto 429) no desperdician el presupuesto de rastreo. Google ha intentado rastrear la página, pero ha recibido un código de estado y ningún otro contenido.