Práticas recomendadas de estrutura de URL para o Google

O Google aceita URLs, conforme definido pela RFC 3986. Os caracteres definidos pelo padrão como reservados precisam ser codificados com porcentagem. Caracteres ASCII não reservados podem ser deixados no formato não codificado. Além disso, os caracteres do intervalo não ASCII precisam ser codificados em UTF-8.

Quando possível, use palavras legíveis em vez de longos números de ID nos URLs.

Recomendado — palavras simples e descritivas no URL:

https://en.wikipedia.org/wiki/Aviation

Recomendado: palavras localizadas no URL, se aplicável.

https://www.example.com/lebensmittel/pfefferminz

Recomendado: use a codificação UTF-8 conforme necessário. Por exemplo, o exemplo a seguir usa a codificação UTF-8 para caracteres árabes no URL:

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

O exemplo a seguir usa a codificação UTF-8 para caracteres chineses no URL:

https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

O exemplo a seguir usa a codificação UTF-8 para o umlaut no URL:

https://www.example.com/gem%C3%BCse

O exemplo a seguir usa a codificação UTF-8 para emojis no URL:

https://example.com/%F0%9F%A6%99%E2%9C%A8

Não recomendado: usar caracteres não ASCII no URL:

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

Não recomendado: números de ID longos e ilegíveis no URL:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Caso seu site seja multirregional, considere usar uma estrutura de URL que facilite a segmentação geográfica dele. Para ver mais exemplos de como estruturar os URLs, consulte Usar URLs específicos à localidade.

Recomendado — domínio específico a cada país:

https://example.de

Recomendado — subdiretório específico a cada país com gTLD:

https://example.com/de/

Use hifens para separar palavras nos URLs, porque isso ajuda os usuários e mecanismos de pesquisa a identificar conceitos com mais facilidade. Recomendamos que você use hifens (-) em vez de sublinhados (_) nos URLs.

Recomendado — hifens (-):

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

Não recomendado — sublinhados (_):

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

Não recomendado — palavras unidas no URL:

https://www.example.com/greendress

Problemas comuns relacionados a URLs

URLs muito complexos, especialmente os que têm vários parâmetros, podem causar problemas para os rastreadores, criando números muito altos de URLs que apontam para um conteúdo idêntico ou semelhante no site. Como resultado, o Googlebot pode consumir mais largura de banda do que o necessário ou não indexar completamente o conteúdo do site.

Um número desnecessariamente alto de URLs pode ser causado por vários problemas. Veja alguns deles:

  • Filtragem aditiva de um conjunto de itens. Vários sites oferecem diferentes modos de exibição dos mesmos conjuntos de itens ou resultados de pesquisa e muitas vezes permitem que o usuário filtre esse conjunto usando um critério definido (por exemplo: mostrar hotéis na praia). Quando os filtros podem ser combinados de maneira aditiva (por exemplo: hotéis na praia e com academia), o número de URLs (modos de visualização de dados) nos sites aumenta drasticamente. Criar muitas listas de hotéis com diferenças sutis é redundante, porque o Googlebot só precisa ver um número pequeno de listas para acessar a página de cada hotel. Exemplo:
    • Hotéis com tarifas promocionais:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Hotéis com tarifas promocionais na praia:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Hotéis com tarifas promocionais na praia e com academia:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Geração dinâmica de documentos. Isso pode resultar em pequenas mudanças por causa dos contadores, dos carimbos de data/hora ou dos anúncios.
  • Parâmetros problemáticos no URL. Os IDs de sessão, por exemplo, podem criar uma imensa quantidade de duplicação e um número maior ainda de URLs.
  • Parâmetros de classificação. Alguns grandes sites de compras oferecem várias maneiras de classificar os mesmos itens, o que resulta em um número muito maior de URLs. Por exemplo:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parâmetros irrelevantes no URL, como os de referência. Exemplo:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemas de agenda. Uma agenda gerada de maneira dinâmica pode criar links para datas passadas e futuras sem restrições de início nem término. Exemplo:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • Links relativos corrompidos. Eles costumam causar espaços infinitos. Geralmente, esse problema ocorre devido a elementos de caminhos repetitivos. Exemplo:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Resolver problemas relacionados a URLs

Para evitar possíveis problemas com a estrutura do URL, é recomendável fazer o seguinte:

  • Crie uma estrutura de URL simples. Organize seu conteúdo de modo que os URLs sejam de fácil compreensão e elaborados de maneira lógica.
  • Considere o uso de um arquivo robots.txt para bloquear o acesso do Googlebot a URLs problemáticos. Normalmente, é recomendável bloquear URLs dinâmicos, como URLs que geram resultados de pesquisa ou URLs que podem criar espaços infinitos, como agendas. Usar expressões comuns no arquivo robots.txt permite bloquear um grande número de URLs com facilidade.
  • Sempre que possível, evite o uso de IDs de sessão nos URLs. Em vez disso, considere os cookies.
  • Se o texto em maiúsculas e minúsculas em um URL for tratado do mesmo jeito pelo servidor da Web, deixe todo o texto no mesmo tamanho de letra para que o Google identifique mais facilmente que os URLs fazem referência à mesma página.
  • Sempre que possível, abrevie URLs removendo parâmetros desnecessários.
  • Caso o site tenha uma agenda infinita, inclua um atributo nofollow aos links para as futuras páginas de agenda criadas dinamicamente.
  • Veja se há links relativos corrompidos no site.