Cómo rastrea Google las páginas que se adaptan según la configuración regional
Si tu sitio tiene páginas que se adaptan en función de la configuración regional de los usuarios (es decir, si tu sitio devuelve contenido diferente según el país detectado o el idioma preferido de los visitantes), es posible que no rastreemos, indexemos ni posicionemos todo tu contenido adaptado. Esta situación se debe a que las direcciones IP predeterminadas del robot de Google parecen proceder de Estados Unidos. Además, el rastreador envía solicitudes HTTP sin definir Accept-Language
en el encabezado de solicitud.
Rastreo distribuido según la ubicación
Además de con direcciones IP de Estados Unidos, el robot de Google rastrea contenido con direcciones IP que se encuentran fuera de este país.
Como siempre hemos recomendado, cuando el robot de Google parezca proceder de un país determinado, trátalo como si fuera cualquier otro usuario de ese país. Es decir, si no permites que los usuarios de Estados Unidos accedan a tu contenido, pero sí das permiso a los visitantes de Australia, tu servidor debe bloquear el robot de Google si parece que proviene de Estados Unidos, pero darle acceso si parece proceder de Australia.
Otras consideraciones
- El robot de Google utiliza la misma cadena de user-agent para todas las configuraciones de rastreo. Consulta más información sobre las cadenas de user-agent que utilizan los rastreadores de Google.
- Verifica los rastreos distribuidos según la ubicación del robot de Google con peticiones de DNS invertidas.
- Asegúrate de que en tu sitio se utiliza el protocolo de exclusión para robots de forma coherente con todas las configuraciones regionales. Es decir, las etiquetas
meta
de robots y el archivo robots.txt deben especificar las mismas reglas para todas las configuraciones regionales.