Segunda-feira, 2 de maio de 2011
  Imagine que você está usando as Ferramentas do Google para webmasters só para ver como seu site é incrível, quando de repente… A
  página Erros de rastreamento
  está cheia de
  erros 404 (Not found).
  Está tudo perdido?
 
  Não tenha medo, jovem padawan. Vamos analisar os erros 404 e como eles afetam ou não seu site:
  P: Os erros 404 informados nas Ferramentas do Google para webmasters afetam a classificação do meu site?
  R: Os erros 404 são uma parte perfeitamente normal da Web. A Internet está sempre
  mudando, conteúdo novo nasce, conteúdo antigo morre e, quando morre, retorna (idealmente) um
  código de resposta HTTP 404. Os mecanismos de pesquisa estão cientes disso. Há erros 404
  nos nossos sites, como é possível ver acima, e os encontramos em toda a Web. Na verdade, nós
  preferimos que, ao se livrar de uma página do seu site, você garanta que ela
  retorne uma resposta 404 ou 410 adequada (em vez de soft
  404). Lembre-se de que, para que nosso rastreador veja o código de resposta HTTP de um
  URL, ele precisa ser capaz de rastreá-lo. Se o URL estiver bloqueado pelo arquivo robots.txt, não vai ser possível rastrear e ver o código de resposta. O fato de alguns URLs do site não existirem mais
ou
  retornarem erros 404 não afeta o desempenho dos outros URLs do site (aqueles que retornam
  códigos
  de status 200 (Success)) nos resultados da pesquisa.
  P: Os erros 404 não prejudicam meu site?
  R: Se alguns URLs do seu site tiverem erros 404, você não será prejudicado
  nos resultados da pesquisa do Google. No entanto, pode haver outros motivos para você querer resolver
  determinados tipos de erros 404. Por exemplo, se algumas das páginas com erros
  404 são realmente importantes, analise por que estamos vendo
  erros 404 ao rastreá-las. Caso você veja um erro ortográfico de um URL legítimo
  (www.example.com/awsome em vez de www.example.com/awesome), é provável que alguém tenha tentado
  criar um link para você e simplesmente cometeu um erro de digitação. Em vez de retornar um erro 404, você pode
  fazer o redirecionamento 301 do URL com erro de ortografia ao URL correto e capturar o tráfego pretendido
  desse link. Também é possível garantir que, quando os usuários acessarem a página 404 do
  seu site, você
  os ajude a encontrar o que estavam procurando
  em vez de apenas dizer "404 Não encontrado".
  P: Conte mais sobre os "erros soft 404".
  R: Um
  soft 404
  ocorre quando um servidor da Web retorna um código de resposta diferente de 404 (ou 410) para
  um URL que não existe. Um exemplo comum é quando o proprietário de um site quer retornar
 uma página 404 bonita com informações úteis para os usuários
 e acha que, para veicular conteúdo aos usuários, é preciso retornar um código de resposta 200. Mas isso não é verdade. Você pode retornar um código de resposta 404 enquanto exibe
  o conteúdo que quiser. Outro exemplo é quando um site redireciona URLs desconhecidos para a
  página inicial dele em vez de retornar erros 404. Ambos os casos podem ter efeitos negativos
  na compreensão e na indexação do site. Portanto, recomendamos que você confira se o servidor
  retorna os códigos de resposta adequados para conteúdo inexistente. Lembre-se de quesó porque uma páginadiz "404 Not Found", não significa que ela retorne um
404 Código de resposta HTTP: use o Buscar como o Googlebot 
 nas Ferramentas do Google para webmasters para verificar novamente. Se você não souber como configurar o servidor para
  retornar os códigos de resposta corretos, consulte a documentação de ajuda do seu host da Web.
  Pergunta: como saber se um URL precisa ser 404, 301 ou
    410?
  Resposta: quando você remover uma página do site, analise se esse conteúdo está sendo movido para outro
  lugar ou se você não quer mais ter esse tipo de conteúdo no site. Se o conteúdo for movido para um novo URL, redirecione com 301 o URL antigo para o novo. Assim, quando
  os usuários acessarem o URL antigo procurando pelo conteúdo, eles vão ser automaticamente redirecionados
  para um conteúdo relevante em relação ao que procuravam. Se você está descartando todo o conteúdo
  e não tem nada no site que preencha a mesma necessidade do usuário, o URL antigo deve
  retornar um erro 404 ou 410. Atualmente, o Google trata
  410 (Gone) da mesma forma que 404 (Not found). Por isso, não é relevante para nós
  qual você retorne.
  Pergunta: a maioria dos erros 404 são de URLs bizarros que nunca existiram no meu site.
    O que está acontecendo? De onde eles vieram?
  Resposta: se o Google encontrar um link em algum lugar da Web que aponte para um URL no seu domínio, talvez ele tente
  rastrear esse link, independentemente do seu conteúdo existir ou não. Quando isso acontece, o servidor
  precisa retornar um 404 se não houver nada para encontrar. Esses links podem ser
 causados por alguém que cometeu um erro de digitação ao vincular você, algum tipo de erro de configuração (se os links
 forem gerados automaticamente, por exemplo, por um CMS) ou pelas iniciativas crescentes do Google em reconhecer
  e rastrear links incorporados em JavaScript ou outro conteúdo incorporado ou ainda podem fazer parte de uma rápida
 verificação para saber como o servidor lida com URLs desconhecidos, entre outros. Ignore
  os erros 404 encontrados nas Ferramentas do Google para webmasters em URLs que não
  existem no seu site. Não sabemos quais URLs são importantes para você e quais precisam ser
  404. Por isso, mostramos todos os erros 404 encontrados no seu site e
 deixamos você decidir o que exige atenção.
  P: alguém copiou meu site e causou muitos erros 404 no
    processo. Todos são URLs "reais" com outros códigos adicionados, como
    https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>
    Isso vai prejudicar meu site?
  R: Geralmente, não é preciso se preocupar com links corrompidos como esses prejudicando seu site. Entendemos
  que os proprietários de sites têm pouco ou nenhum controle sobre as pessoas que copiam seu site ou
  vinculam a eles de maneiras estranhas. Se você tiver um bom senso de
  regex,
  considere
  redirecionar esses URLs, mas geralmente
  não vale a pena se preocupar com isso. Também é possível enviar um
  pedido de remoção
  quando você acreditar que alguém está roubando conteúdo original do seu site.
  P: Na semana passada, corrigimos todos os erros 404 informados pelas Ferramentas do Google para webmasters, mas eles ainda aparecem na minha conta. Isso significa que não corrigi os problemas corretamente? Quanto tempo levará para que eles desapareçam?
  R: Confira a coluna "Detectado" na página "Erros de rastreamento". Essa é a data mais recente em
  que detectamos cada erro. Se as datas nessa coluna forem anteriores ao momento em que você corrigiu os erros, isso significa que esses erros não foram encontrados desde essa data. Se as datas forem mais
  recentes, isso significa que continuamos encontrando esses erros 404 durante o rastreamento.
Depois de implementar uma correção, você pode verificar se o rastreador está exibindo o novo código de resposta usando o Buscar como o Googlebot. Teste alguns URLs e, se eles estiverem bons, esses erros começarão a desaparecer da lista de erros de rastreamento.
  Pergunta: posso usar a ferramenta de remoção de URL do Google para fazer com que os erros 404 desapareçam da minha
 conta mais rápido?
  
  Resposta: não. A Ferramenta de remoção de URL remove URLs dos resultados da pesquisa do Google, e não da sua conta das Ferramentas do Google
  para webmasters. Ela foi projetada somente para solicitações de remoção urgentes, e o uso não é necessário quando um
  URL já retorna um erro 404. O URL vai sair dos nossos resultados da pesquisa
  naturalmente ao longo do tempo. Veja na parte inferior
  desta postagem do blog
  mais detalhes sobre o que a Ferramenta de remoção de URL pode e não pode fazer por você.
  Ainda quer saber mais sobre os erros 404? Confira
  404 semanal no nosso blog ou
  acesse nosso
  Fórum de Ajuda para webmasters.