Práticas recomendadas de estrutura de URL para a Pesquisa Google
A fim de garantir que a Pesquisa Google possa rastrear seu site de maneira eficaz, use uma estrutura de URL rastreável que atenda aos requisitos abaixo. Se os URLs não atenderem aos critérios a seguir, a Pesquisa Google provavelmente vai rastrear seu site de maneira ineficiente, incluindo, entre outras coisas, taxas de rastreamento extremamente altas ou zeradas.
Requisitos para uma estrutura de URL rastreável | |||||||
---|---|---|---|---|---|---|---|
Seguir a IETF STD 66 |
A Pesquisa Google aceita URLs, conforme definido pela IETF STD 66. Os caracteres definidos pelo padrão como reservados precisam ser codificados por porcentagem. |
||||||
Não usar fragmentos de URL para mudar o conteúdo |
Não use fragmentos para mudar o conteúdo de uma página, já que a Pesquisa Google geralmente não oferece suporte a URLs com fragmentos. Veja um exemplo de fragmento do URL: https://example.com/#/potatoes Se você usa JavaScript para mudar o conteúdo, utilize a API History em vez disso. |
||||||
Usar uma codificação comum para parâmetros de URL |
Ao especificar parâmetros de URL, use a codificação comum a seguir: um sinal de igual
(
|
Facilitar a compreensão da estrutura de URL
Para ajudar a Pesquisa Google (e os usuários) a entender melhor seu site, recomendamos criar uma estrutura de URL simples, aplicando as práticas recomendadas abaixo sempre que possível.
Práticas recomendadas | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Usar URLs descritivos |
Quando possível, use palavras legíveis em vez de longos números de ID nos URLs.
|
||||||||||
Usar o idioma do público-alvo |
Use palavras no idioma do público-alvo no URL. Se aplicável, use palavras transliteradas. Por exemplo, se o público-alvo estiver pesquisando em alemão, use palavras em alemão no URL: https://example.com/lebensmittel/pfefferminz Ou, se o público-alvo pesquisar em japonês, use palavras em japonês no URL: https://example.com/ペパーミント |
||||||||||
Usar a codificação UTF-8 conforme necessário |
Ao vincular a páginas do seu site,
use a codificação UTF-8 nos atributos
|
||||||||||
Usar hífens para separar palavras |
Recomendamos separar as palavras nos URLs, quando possível. Especificamente, recomendamos o uso de
hifens (
|
||||||||||
Usar o menor número possível de parâmetros |
Sempre que possível, abrevie URLs removendo parâmetros desnecessários, ou seja, parâmetros que não mudam o conteúdo. | ||||||||||
Os URLs diferenciam maiúsculas de minúsculas |
Como qualquer outro cliente HTTP que segue a IETF STD 66, o processamento de URLs da Pesquisa Google diferencia
maiúsculas de minúsculas. Por exemplo, o Google trata /APPLE e /apple como
URLs distintos com conteúdo próprio. Se o texto em maiúsculas e minúsculas em um URL for tratado
do mesmo jeito pelo servidor da Web, deixe todo o texto no mesmo tamanho de letra para que o Google
identifique mais facilmente que os URLs fazem referência à mesma página.
|
||||||||||
Para sites multirregionais |
Caso seu site seja multirregional, considere usar uma estrutura de URL que facilite a segmentação geográfica dele. Para ver mais exemplos de como estruturar os URLs, consulte Usar URLs específicos à localidade. Recomendado (usar um domínio específico do país): https://example.de Recomendado (usar um subdiretório específico do país com gTLD): https://example.com/de/ |
Evitar problemas comuns relacionados a URLs
URLs muito complexos, especialmente os que têm vários parâmetros, podem causar problemas para os rastreadores, criando números muito altos de URLs que apontam para um conteúdo idêntico ou semelhante no site. Como resultado, o Googlebot pode consumir mais largura de banda do que o necessário, ou a Pesquisa Google pode não indexar completamente o conteúdo do site.
Um número desnecessariamente alto de URLs pode ser causado por vários problemas. Entre eles:
Problemas comuns | |
---|---|
Filtragem aditiva de um conjunto de itens. |
Vários sites oferecem diferentes modos de exibição dos mesmos conjuntos de itens ou resultados de pesquisa e muitas vezes permitem que o usuário filtre esse conjunto usando um critério definido (por exemplo: mostrar hotéis na praia). Quando os filtros podem ser combinados de maneira aditiva (por exemplo: hotéis na praia e com academia), o número de URLs (modos de visualização de dados) nos sites aumenta drasticamente. Criar muitas listas de hotéis com diferenças sutis é redundante, porque o Googlebot só precisa ver um número pequeno de listas para acessar a página de cada hotel. Exemplo:
|
Parâmetros irrelevantes |
Parâmetros irrelevantes no URL podem causar um grande número de URLs, como:
Considere usar um arquivo robots.txt para bloquear o acesso do Googlebot a esses URLs problemáticos. |
Problemas de agenda |
Uma agenda gerada de maneira dinâmica pode criar links para datas passadas e futuras sem restrições de início nem término. Exemplo: https://example.com/calendar.php?d=13&m=8&y=2011
Caso o site tenha uma agenda infinita, inclua um atributo |
Links relativos corrompidos |
Colocar um link relativo ao pai
na página errada pode criar espaços infinitos se o servidor não responder com o
código de status HTTP correto para páginas inexistentes. Por exemplo, um link relativo ao pai, como
<a href="../../category/stuff">...</a> em https://example.com/category/community/070413/html/FAQ.htm ,
pode levar a URLs falsos, como https://example.com/category/community/category/stuff .
Para corrigir, use URLs relativos à raiz nos links (em vez de relativos ao pai).
|
Correção de problemas de estrutura de URLs relacionados ao rastreamento
Se você notar que a Pesquisa Google está rastreando esses URLs problemáticos, recomendamos o seguinte:
- Considere usar um arquivo robots.txt para bloquear o acesso do Googlebot a URLs problemáticos. Normalmente, é recomendável bloquear URLs dinâmicos, como URLs que geram resultados de pesquisa ou que podem criar espaços infinitos, como agendas, e funções de ordenação e filtragem.
- Se o site tiver navegação facetada, saiba como gerenciar o rastreamento desses URLs.