Prácticas recomendadas para la estructura de las URLs en Google

Google admite las URLs, según lo que define la RFC 3986. Los caracteres que el estándar define como reservados deben estar codificados en porcentajes. Los caracteres ASCII sin reserva pueden dejarse en un formato no codificado. Además, los caracteres en el rango que no es ASCII deben estar codificados en UTF-8.

Cuando sea posible, usa palabras legibles en las URLs en lugar de números de ID largos.

Recomendación: Palabras simples y descriptivas en la URL:

https://en.wikipedia.org/wiki/Aviation

Recomendación: Palabras localizadas en la URL, si corresponde.

https://www.example.com/lebensmittel/pfefferminz

Recomendación: Usa la codificación UTF-8 según sea necesario. En el siguiente ejemplo, se usa la codificación UTF-8 para caracteres árabes en la URL:

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

En el siguiente ejemplo, se usa la codificación UTF-8 para caracteres chinos en la URL:

https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

En el siguiente ejemplo, se usa la codificación UTF-8 para la diéresis en la URL:

https://www.example.com/gem%C3%BCse

En el siguiente ejemplo, se usa la codificación UTF-8 para emojis en la URL:

https://example.com/%F0%9F%A6%99%E2%9C%A8

No se recomienda usar caracteres que no sean ASCII en la URL:

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

No se recomienda usar números de ID largos e ilegibles en la URL:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Si tu sitio es multirregional, procura usar una estructura de URL que facilite la segmentación geográfica. Para ver más ejemplos de cómo estructurar las URLs, consulta Usa URLs específicas de configuración regional.

Recomendación: Dominio específico por país:

https://example.de

Se recomienda el uso de subdirectorios específicos por país con gTLD:

https://example.com/de/

Considera usar guiones para separar las palabras en tus URLs, ya que eso ayuda a los usuarios y a los motores de búsqueda a identificar conceptos en ellas con mayor facilidad. Te recomendamos que uses guiones (-) en lugar de guiones bajos (_) en tus URLs.

Se recomienda el uso de guiones (-):

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

No se recomienda el uso de guiones bajos (_):

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

No se recomienda el uso de palabras en la URL sin separación alguna, por ejemplo:

https://www.example.com/greendress

Problemas habituales relacionados con las URLs

Las URLs demasiado complejas, en especial aquellas que contienen varios parámetros, pueden causar problemas a los rastreadores, ya que crean cantidades excesivas e innecesarias de URLs que dirigen a un contenido idéntico o similar en tu sitio. Como resultado, es posible que Googlebot consuma mucho más ancho de banda de lo necesario o que no pueda indexar por completo todo el contenido de tu sitio.

Existen diferentes motivos por los que podrías tener una cantidad excesiva e innecesaria de URLs. Estos son algunos ejemplos:

  • Filtrado aditivo de un conjunto de elementos. Muchos sitios proporcionan diferentes vistas del mismo conjunto de elementos o de resultados de la búsqueda, lo que suele permitir que el usuario filtre este conjunto mediante criterios definidos (por ejemplo: muéstrame hoteles en la playa). Cuando los filtros pueden combinarse de manera aditiva (por ejemplo, hoteles en la playa y con gimnasio), la cantidad de URLs (vistas de datos) de los sitios crece exponencialmente. Crear muchas listas de hoteles levemente diferentes resulta redundante, ya que Googlebot solo necesita ver una pequeña cantidad de ellas para llegar a la página de cada hotel. Por ejemplo:
    • Propiedades de hoteles por "tarifa":
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Propiedades de hoteles por "tarifa" en la playa:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Propiedades de hoteles por "tarifa" en la playa y con gimnasio:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Generación dinámica de documentos. Esto puede provocar cambios pequeños debido a anuncios, contadores o marcas de tiempo.
  • Parámetros problemáticos en la URL: Los IDs de sesión, por ejemplo, pueden crear enormes cantidades de duplicación y una mayor cantidad de URLs.
  • Parámetros de ordenamiento: Algunos sitios de compras grandes ofrecen varias maneras de ordenar los mismos artículos, lo que resulta en una gran cantidad de URLs. Por ejemplo:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parámetros irrelevantes en la URL, como los parámetros de referencia: Por ejemplo:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemas con el calendario: Es posible que un calendario generado de forma dinámica cree vínculos a fechas futuras y anteriores sin restringir las fechas de inicio y de finalización. Por ejemplo:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • Vínculos relacionados rotos. Los vínculos relacionados rotos a menudo pueden causar espacios infinitos. Con frecuencia, este problema se presenta debido a la repetición de elementos de ruta de acceso. Por ejemplo:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Cómo resolver problemas relacionados con las URLs

A fin de evitar posibles problemas con la estructura de una URL, te recomendamos que hagas lo siguiente:

  • Crea una estructura de URL simple. Procura organizar tu contenido de manera que las URLs se construyan de forma lógica y sean comprensibles para los seres humanos.
  • Usa un archivo robots.txt para bloquear el acceso de Googlebot a las URLs problemáticas. Como regla general, considera bloquear las URLs dinámicas, como las que generan resultados de las búsquedas, o aquellas que pueden crear espacios infinitos, como los calendarios. Si usas expresiones regulares en el archivo robots.txt, podrás bloquear fácilmente grandes cantidades de URLs.
  • Cuando sea posible, evita el uso de IDs de sesión en las URLs y considera usar cookies en su lugar.
  • Si el servidor web trata de la misma manera el texto en mayúsculas y en minúsculas de una URL, conviértelo al mismo tipo de letra, de modo que Google pueda determinar más fácilmente que las URLs hacen referencia a la misma página.
  • Siempre que sea posible, acorta las URLs con el recorte de parámetros innecesarios.
  • Si tu sitio tiene un calendario infinito, agrega un atributo nofollow a los vínculos que dirigen a páginas de calendario futuras creadas de forma dinámica.
  • Revisa tu sitio para comprobar si hay vínculos relacionados que no funcionan.