Mantén una estructura de URL simple

La estructura de URL de un sitio debe ser lo más simple posible. Procura organizar tu contenido de manera que las URL se construyan de forma lógica y sean comprensibles para los seres humanos.

Cuando sea posible, usa palabras legibles en las URLs en lugar de números de ID largos.

Recomendación: Palabras simples y descriptivas en la URL:

http://en.wikipedia.org/wiki/Aviation

Recomendación: Palabras localizadas en la URL, si corresponde. Usa la codificación UTF-8 según sea necesario.

example.com/lebensmittel/pfefferminz

No se recomienda usar números de ID largos e ilegibles en la URL:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Si tu sitio es multirregional, procura usar una estructura de URL que facilite la segmentación geográfica. Para ver más ejemplos de cómo estructurar las URLs, consulta Usa URLs específicas de configuración regional.

Recomendación: Dominio específico por país:

example.de

Recomendación: Subdirectorio específico por país con gTLD:

example.com/de/

Considera usar guiones en las URLs, ya que ayuda a los usuarios y a los motores de búsqueda a identificar conceptos en ellas con mayor facilidad.

Recomendación: Palabras clave en la URL separadas por un guion:

https://www.example.com/green-dress

No se recomienda el uso de palabras claves en la URL sin separación alguna, por ejemplo:

https://www.example.com/greendress

Te recomendamos que uses guiones (-) en lugar de guiones bajos (_) en tus URLs.

Recomendación: guiones (-):

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

No se recomiendan el uso de guiones bajos (_):

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

Las URLs demasiado complejas, en especial aquellas que contienen varios parámetros, pueden causar problemas a los rastreadores, ya que crean cantidades excesivas e innecesarias de URLs que dirigen a contenido idéntico o similar en tu sitio. Como resultado, es posible que Googlebot consuma mucho más ancho de banda de lo necesario o que no pueda indexar por completo todo el contenido de tu sitio.

Causas comunes de este problema

Existen diferentes motivos por los que podrías tener una cantidad excesiva e innecesaria de URL. Estos son algunos ejemplos:

  • Filtrado aditivo de un conjunto de elementos. Muchos sitios proporcionan diferentes vistas del mismo conjunto de elementos o de resultados de la búsqueda, lo que suele permitir que el usuario filtre este conjunto mediante criterios definidos (por ejemplo: muéstrame hoteles en la playa). Cuando los filtros pueden combinarse de manera aditiva (por ejemplo, hoteles en la playa y con gimnasio), la cantidad de URL (vistas de datos) de los sitios crece exponencialmente. Crear muchas listas de hoteles levemente diferentes resulta redundante, ya que Googlebot solo necesita ver una pequeña cantidad de ellas para llegar a la página de cada hotel. For example:
    • Propiedades de hoteles por "tarifa":
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Propiedades de hoteles por "tarifa" en la playa:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Propiedades de hoteles por "tarifa" en la playa y con gimnasio:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Generación dinámica de documentos. Esto puede provocar cambios pequeños debido a contadores, marcas de tiempo o anuncios.
  • Parámetros problemáticos en la URL: Los ID de sesión, por ejemplo, pueden crear enormes cantidades de duplicación y una mayor cantidad de URL.
  • Parámetros de ordenamiento: Algunos sitios de compras grandes ofrecen varias maneras de ordenar los mismos artículos, lo que resulta en una gran cantidad de URL. Por ejemplo:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parámetros irrelevantes en la URL, como los parámetros de referencia: a continuación, se muestran ejemplos.
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemas con el calendario: Es posible que un calendario generado de forma dinámica cree vínculos a fechas futuras y anteriores sin restringir las fechas de inicio y finalización. Por ejemplo:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • Vínculos relacionados rotos: Los vínculos relacionados rotos a menudo pueden causar espacios infinitos. Con frecuencia, este problema se presenta debido a la repetición de elementos de ruta de acceso. Por ejemplo:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Cómo resolver este problema

A fin de evitar posibles problemas con la estructura de URL, te recomendamos que hagas lo siguiente:

  • Usa un archivo robots.txt para bloquear el acceso de Googlebot a las URL problemáticas. Como regla general, considera bloquear las URL dinámicas, como las que generan resultados de las búsquedas, o aquellas que pueden crear espacios infinitos, como los calendarios. Si usas expresiones regulares en el archivo robots.txt, podrás bloquear fácilmente grandes cantidades de URL.
  • Cuando sea posible, evita el uso de ID de sesión en las URL y considera usar cookies en su lugar. Para obtener más información consulta nuestros lineamientos para webmasters.
  • Siempre que sea posible, acorta las URL mediante el recorte de parámetros innecesarios.
  • Si tu sitio tiene un calendario infinito, agrega un atributo nofollow a los vínculos que dirigen a páginas de calendario futuras creadas de forma dinámica.
  • Revisa tu sitio a fin de comprobar si hay vínculos relacionados que no funcionan.