Segunda-feira, 2 de maio de 2011
Imagine que você está usando as Ferramentas do Google para webmasters só para ver como seu site é incrível, quando de repente… A
página Erros de rastreamento
está cheia de
erros 404 (Not found)
.
Está tudo perdido?
Não tenha medo, jovem padawan. Vamos analisar os erros 404
e como eles afetam ou não seu site:
P: Os erros 404
informados nas Ferramentas do Google para webmasters afetam a classificação do meu site?
R: Os erros 404
são uma parte perfeitamente normal da Web. A Internet está sempre
mudando, conteúdo novo nasce, conteúdo antigo morre e, quando morre, retorna (idealmente) um
código de resposta HTTP 404
. Os mecanismos de pesquisa estão cientes disso. Há erros 404
nos nossos sites, como é possível ver acima, e os encontramos em toda a Web. Na verdade, nós
preferimos que, ao se livrar de uma página do seu site, você garanta que ela
retorne uma resposta 404
ou 410
adequada (em vez de soft
404
). Lembre-se de que, para que nosso rastreador veja o código de resposta HTTP de um
URL, ele precisa ser capaz de rastreá-lo. Se o URL estiver bloqueado pelo arquivo robots.txt, não vai ser possível rastrear e ver o código de resposta. O fato de alguns URLs do site não existirem mais
ou
retornarem erros 404
não afeta o desempenho dos outros URLs do site (aqueles que retornam
códigos
de status 200 (Success)
) nos resultados da pesquisa.
P: Os erros 404
não prejudicam meu site?
R: Se alguns URLs do seu site tiverem erros 404
, você não será prejudicado
nos resultados da pesquisa do Google. No entanto, pode haver outros motivos para você querer resolver
determinados tipos de erros 404
. Por exemplo, se algumas das páginas com erros
404
são realmente importantes, analise por que estamos vendo
erros 404
ao rastreá-las. Caso você veja um erro ortográfico de um URL legítimo
(www.example.com/awsome em vez de www.example.com/awesome), é provável que alguém tenha tentado
criar um link para você e simplesmente cometeu um erro de digitação. Em vez de retornar um erro 404
, você pode
fazer o redirecionamento 301
do URL com erro de ortografia ao URL correto e capturar o tráfego pretendido
desse link. Também é possível garantir que, quando os usuários acessarem a página 404
do
seu site, você
os ajude a encontrar o que estavam procurando
em vez de apenas dizer "404
Não encontrado".
P: Conte mais sobre os "erros soft 404
".
R: Um
soft 404
ocorre quando um servidor da Web retorna um código de resposta diferente de 404
(ou 410
) para
um URL que não existe. Um exemplo comum é quando o proprietário de um site quer retornar
uma página 404
bonita com informações úteis para os usuários
e acha que, para veicular conteúdo aos usuários, é preciso retornar um código de resposta 200
. Mas isso não é verdade. Você pode retornar um código de resposta 404
enquanto exibe
o conteúdo que quiser. Outro exemplo é quando um site redireciona URLs desconhecidos para a
página inicial dele em vez de retornar erros 404
. Ambos os casos podem ter efeitos negativos
na compreensão e na indexação do site. Portanto, recomendamos que você confira se o servidor
retorna os códigos de resposta adequados para conteúdo inexistente. Lembre-se de quesó porque uma páginadiz "404
Not Found", não significa que ela retorne um
404
Código de resposta HTTP: use o Buscar como o Googlebot
nas Ferramentas do Google para webmasters para verificar novamente. Se você não souber como configurar o servidor para
retornar os códigos de resposta corretos, consulte a documentação de ajuda do seu host da Web.
Pergunta: como saber se um URL precisa ser 404
, 301
ou
410
?
Resposta: quando você remover uma página do site, analise se esse conteúdo está sendo movido para outro
lugar ou se você não quer mais ter esse tipo de conteúdo no site. Se o conteúdo for movido para um novo URL, redirecione com 301
o URL antigo para o novo. Assim, quando
os usuários acessarem o URL antigo procurando pelo conteúdo, eles vão ser automaticamente redirecionados
para um conteúdo relevante em relação ao que procuravam. Se você está descartando todo o conteúdo
e não tem nada no site que preencha a mesma necessidade do usuário, o URL antigo deve
retornar um erro 404
ou 410
. Atualmente, o Google trata
410 (Gone)
da mesma forma que 404 (Not found)
. Por isso, não é relevante para nós
qual você retorne.
Pergunta: a maioria dos erros 404
são de URLs bizarros que nunca existiram no meu site.
O que está acontecendo? De onde eles vieram?
Resposta: se o Google encontrar um link em algum lugar da Web que aponte para um URL no seu domínio, talvez ele tente
rastrear esse link, independentemente do seu conteúdo existir ou não. Quando isso acontece, o servidor
precisa retornar um 404
se não houver nada para encontrar. Esses links podem ser
causados por alguém que cometeu um erro de digitação ao vincular você, algum tipo de erro de configuração (se os links
forem gerados automaticamente, por exemplo, por um CMS) ou pelas iniciativas crescentes do Google em reconhecer
e rastrear links incorporados em JavaScript ou outro conteúdo incorporado ou ainda podem fazer parte de uma rápida
verificação para saber como o servidor lida com URLs desconhecidos, entre outros. Ignore
os erros 404
encontrados nas Ferramentas do Google para webmasters em URLs que não
existem no seu site. Não sabemos quais URLs são importantes para você e quais precisam ser
404
. Por isso, mostramos todos os erros 404
encontrados no seu site e
deixamos você decidir o que exige atenção.
P: alguém copiou meu site e causou muitos erros 404
no
processo. Todos são URLs "reais" com outros códigos adicionados, como
https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>
Isso vai prejudicar meu site?
R: Geralmente, não é preciso se preocupar com links corrompidos como esses prejudicando seu site. Entendemos
que os proprietários de sites têm pouco ou nenhum controle sobre as pessoas que copiam seu site ou
vinculam a eles de maneiras estranhas. Se você tiver um bom senso de
regex,
considere
redirecionar esses URLs, mas geralmente
não vale a pena se preocupar com isso. Também é possível enviar um
pedido de remoção
quando você acreditar que alguém está roubando conteúdo original do seu site.
P: Na semana passada, corrigimos todos os erros 404
informados pelas Ferramentas do Google para webmasters, mas eles ainda aparecem na minha conta. Isso significa que não corrigi os problemas corretamente? Quanto tempo levará para que eles desapareçam?
R: Confira a coluna "Detectado" na página "Erros de rastreamento". Essa é a data mais recente em
que detectamos cada erro. Se as datas nessa coluna forem anteriores ao momento em que você corrigiu os erros, isso significa que esses erros não foram encontrados desde essa data. Se as datas forem mais
recentes, isso significa que continuamos encontrando esses erros 404
durante o rastreamento.
Depois de implementar uma correção, você pode verificar se o rastreador está exibindo o novo código de resposta usando o Buscar como o Googlebot. Teste alguns URLs e, se eles estiverem bons, esses erros começarão a desaparecer da lista de erros de rastreamento.
Pergunta: posso usar a ferramenta de remoção de URL do Google para fazer com que os erros 404
desapareçam da minha
conta mais rápido?
Resposta: não. A Ferramenta de remoção de URL remove URLs dos resultados da pesquisa do Google, e não da sua conta das Ferramentas do Google
para webmasters. Ela foi projetada somente para solicitações de remoção urgentes, e o uso não é necessário quando um
URL já retorna um erro 404
. O URL vai sair dos nossos resultados da pesquisa
naturalmente ao longo do tempo. Veja na parte inferior
desta postagem do blog
mais detalhes sobre o que a Ferramenta de remoção de URL pode e não pode fazer por você.
Ainda quer saber mais sobre os erros 404
? Confira
404
semanal no nosso blog ou
acesse nosso
Fórum de Ajuda para webmasters.