Práticas recomendadas de estrutura de URL para a Pesquisa Google

A fim de garantir que a Pesquisa Google possa rastrear seu site de maneira eficaz, use uma estrutura de URL rastreável que atenda aos requisitos abaixo. Se os URLs não atenderem aos critérios a seguir, a Pesquisa Google provavelmente vai rastrear seu site de maneira ineficiente, incluindo, entre outras coisas, taxas de rastreamento extremamente altas ou zeradas.

Requisitos para uma estrutura de URL rastreável

Seguir a IETF STD 66

A Pesquisa Google aceita URLs, conforme definido pela IETF STD 66. Os caracteres definidos pelo padrão como reservados precisam ser codificados por porcentagem.

Não usar fragmentos de URL para mudar o conteúdo

Não use fragmentos para mudar o conteúdo de uma página, já que a Pesquisa Google geralmente não oferece suporte a URLs com fragmentos. Veja um exemplo de fragmento do URL:

https://example.com/#/potatoes

Se você usa JavaScript para mudar o conteúdo, utilize a API History em vez disso.

Usar uma codificação comum para parâmetros de URL

Ao especificar parâmetros de URL, use a codificação comum a seguir: um sinal de igual (=) para separar pares de chave-valor e adicione outros parâmetros com um "e" comercial (&). Para listar vários valores para a mesma chave em um par de chave-valor, use qualquer caractere que não entre em conflito com a IETF STD 66, como uma vírgula (,).

Recomendado Não recomendado
Usar um sinal de igual (=) para separar pares de chave-valor e um "e" comercial (&) para adicionar outros parâmetros:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Usar dois-pontos (:) para separar pares de chave-valor e colchetes ([ ]) para adicionar outros parâmetros:
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
Usar uma vírgula (,) para listar vários valores para a mesma chave, um sinal de igual (=) para separar pares de chave-valor e um "e" comercial (&) para adicionar outros parâmetros:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
Usar uma vírgula (,) para separar pares de chave-valor e vírgulas duplas (,,) para adicionar outros parâmetros:
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789

Facilitar a compreensão da estrutura de URL

Para ajudar a Pesquisa Google (e os usuários) a entender melhor seu site, recomendamos criar uma estrutura de URL simples, aplicando as práticas recomendadas abaixo sempre que possível.

Práticas recomendadas

Usar URLs descritivos

Quando possível, use palavras legíveis em vez de longos números de ID nos URLs.

Recomendado (palavras simples e descritivas) Não recomendado (números de ID longos e ilegíveis)
https://example.com/wiki/Aviation
https://example.com/index.php?topic=42&area=3a5ebc944f41daa6f849f730f1

Usar o idioma do público-alvo

Use palavras no idioma do público-alvo no URL. Se aplicável, use palavras transliteradas. Por exemplo, se o público-alvo estiver pesquisando em alemão, use palavras em alemão no URL:

https://example.com/lebensmittel/pfefferminz

Ou, se o público-alvo pesquisar em japonês, use palavras em japonês no URL:

https://example.com/ペパーミント

Usar a codificação UTF-8 conforme necessário

Ao vincular a páginas do seu site, use a codificação UTF-8 nos atributos href dos links conforme necessário. Caracteres ASCII não reservados podem ser deixados no formato não codificado. Além disso, os caracteres do intervalo não ASCII precisam ser codificados em UTF-8. Exemplo:

Recomendado (codificação UTF-8) Não recomendado (caracteres não ASCII)
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
https://example.com/نعناع
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
https://example.com/杂货/薄荷
https://example.com/gem%C3%BCse
https://example.com/gemüse
https://example.com/%F0%9F%A6%99%E2%9C%A8
https://example.com/🦙✨

Usar hífens para separar palavras

Recomendamos separar as palavras nos URLs, quando possível. Especificamente, recomendamos o uso de hifens (-) em vez de sublinhados (_) para separar palavras nos URLs, porque isso ajuda os usuários e mecanismos de pesquisa a identificar conceitos no URL. Por motivos históricos, não recomendamos o uso de sublinhados, uma vez que esse estilo já é usado para denotar conceitos que precisam ser mantidos juntos, por exemplo, em várias linguagens de programação ao nomear funções (como format_date).

Recomendado Não recomendado

Usar hífens (-) para separar palavras:

https://example.com/summer-clothing/filter?color-profile=dark-grey

Usar sublinhados (_) para separar palavras:

https://example.com/summer_clothing/filter?color_profile=dark_grey

Mesclar palavras no URL:

https://example.com/greendress

Usar o menor número possível de parâmetros

Sempre que possível, abrevie URLs removendo parâmetros desnecessários, ou seja, parâmetros que não mudam o conteúdo.

Os URLs diferenciam maiúsculas de minúsculas

Como qualquer outro cliente HTTP que segue a IETF STD 66, o processamento de URLs da Pesquisa Google diferencia maiúsculas de minúsculas. Por exemplo, o Google trata /APPLE e /apple como URLs distintos com conteúdo próprio. Se o texto em maiúsculas e minúsculas em um URL for tratado do mesmo jeito pelo servidor da Web, deixe todo o texto no mesmo tamanho de letra para que o Google identifique mais facilmente que os URLs fazem referência à mesma página.

Para sites multirregionais

Caso seu site seja multirregional, considere usar uma estrutura de URL que facilite a segmentação geográfica dele. Para ver mais exemplos de como estruturar os URLs, consulte Usar URLs específicos à localidade.

Recomendado (usar um domínio específico do país):

https://example.de

Recomendado (usar um subdiretório específico do país com gTLD):

https://example.com/de/

Evitar problemas comuns relacionados a URLs

URLs muito complexos, especialmente os que têm vários parâmetros, podem causar problemas para os rastreadores, criando números muito altos de URLs que apontam para um conteúdo idêntico ou semelhante no site. Como resultado, o Googlebot pode consumir mais largura de banda do que o necessário, ou a Pesquisa Google pode não indexar completamente o conteúdo do site.

Um número desnecessariamente alto de URLs pode ser causado por vários problemas. Entre eles:

Problemas comuns

Filtragem aditiva de um conjunto de itens.

Vários sites oferecem diferentes modos de exibição dos mesmos conjuntos de itens ou resultados de pesquisa e muitas vezes permitem que o usuário filtre esse conjunto usando um critério definido (por exemplo: mostrar hotéis na praia). Quando os filtros podem ser combinados de maneira aditiva (por exemplo: hotéis na praia e com academia), o número de URLs (modos de visualização de dados) nos sites aumenta drasticamente. Criar muitas listas de hotéis com diferenças sutis é redundante, porque o Googlebot só precisa ver um número pequeno de listas para acessar a página de cada hotel. Exemplo:

  • Hotéis com tarifas promocionais:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461
  • Hotéis com tarifas promocionais na praia:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
  • Hotéis com tarifas promocionais na praia e com academia:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270

Parâmetros irrelevantes

Parâmetros irrelevantes no URL podem causar um grande número de URLs, como:

  • Parâmetros de referência:
    https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories
  • Parâmetros de classificação do Shopping:
    https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • IDs da sessão:
    https://example.com/search/noheaders?sessionid=6EE2BF1AF6A3D705D5561B7C3564D9C2

Considere usar um arquivo robots.txt para bloquear o acesso do Googlebot a esses URLs problemáticos.

Problemas de agenda

Uma agenda gerada de maneira dinâmica pode criar links para datas passadas e futuras sem restrições de início nem término. Exemplo:

https://example.com/calendar.php?d=13&m=8&y=2011

Caso o site tenha uma agenda infinita, inclua um atributo nofollow aos links para as futuras páginas de agenda criadas dinamicamente.

Colocar um link relativo ao pai na página errada pode criar espaços infinitos se o servidor não responder com o código de status HTTP correto para páginas inexistentes. Por exemplo, um link relativo ao pai, como <a href="../../category/stuff">...</a> em https://example.com/category/community/070413/html/FAQ.htm, pode levar a URLs falsos, como https://example.com/category/community/category/stuff. Para corrigir, use URLs relativos à raiz nos links (em vez de relativos ao pai).

Correção de problemas de estrutura de URLs relacionados ao rastreamento

Se você notar que a Pesquisa Google está rastreando esses URLs problemáticos, recomendamos o seguinte:

  • Considere usar um arquivo robots.txt para bloquear o acesso do Googlebot a URLs problemáticos. Normalmente, é recomendável bloquear URLs dinâmicos, como URLs que geram resultados de pesquisa ou que podem criar espaços infinitos, como agendas, e funções de ordenação e filtragem.
  • Se o site tiver navegação facetada, saiba como gerenciar o rastreamento desses URLs.