Bloquear a indexação da Pesquisa com `noindex`

noindex é um conjunto de regras com uma tag <meta> ou cabeçalho de resposta HTTP que é usado para evitar a indexação de conteúdo por mecanismos de pesquisa compatíveis com a regra noindex, como o Google. Quando o Googlebot rastreia a página e extrai a tag ou o cabeçalho e exclui totalmente a página dos resultados da pesquisa Google, mesmo que outros sites tenham links para ela.

Importante: para que a regra noindex funcione, a página ou recurso não pode ser bloqueado por um arquivo robots.txt e precisa ser acessível pelo rastreador. Se a página estiver bloqueada por um arquivo robots.txt ou se o rastreador não puder acessar a página, ele nunca vai ver a regra noindex. A página ainda pode aparecer nos resultados da pesquisa, por exemplo, caso outras páginas tenham links para ela.

O uso de noindex é útil se você não tem acesso à raiz do servidor, já que ele permite controlar o acesso página por página ao seu site.

Implementação de `noindex`

Há duas maneiras de implementar noindex: como uma tag <meta> e como um cabeçalho de resposta HTTP. Elas têm o mesmo efeito. Escolha o método mais adequado ao tipo de conteúdo e conveniente para o site. O Google não permite especificar a regra noindex no arquivo robots.txt.

Também é possível combinar a regra noindex com outras regras que controlam a indexação. Por exemplo, é possível mesclar uma dica nofollow com uma regra noindex: <meta name="robots" content="noindex, nofollow" />.

Tag `<meta>`

Para impedir que todos os mecanismos de pesquisa compatíveis com a regra noindex indexem uma página no site, coloque a seguinte tag <meta> na seção <head> da sua página:

<meta name="robots" content="noindex">

Para impedir que somente os rastreadores da Web do Google indexem uma página:

<meta name="googlebot" content="noindex">

Talvez alguns mecanismos de pesquisa interpretem a regra noindex de maneira diferente. Consequentemente, é possível que a página continue sendo exibida nos resultados de outros mecanismos de pesquisa.

Saiba mais sobre a tag noindex <meta>.

Cabeçalho de resposta HTTP

Em vez de uma tag <meta>, é possível retornar um cabeçalho HTTP X-Robots-Tag com um valor de noindex ou none na sua resposta. Um cabeçalho de resposta pode ser usado para recursos não HTML, como PDFs e arquivos de vídeo e de imagem. Veja um exemplo de resposta HTTP com um cabeçalho X-Robots-Tag instruindo os mecanismos de pesquisa a não indexar uma página:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Como depurar de problemas de `noindex`

É preciso rastrear sua página para ver as tags <meta> e os cabeçalhos HTTP. Se uma página ainda estiver aparecendo nos resultados, é provável que não tenhamos rastreado a página desde que você adicionou a regra noindex. Pode levar meses para que o Googlebot acesse a página novamente, dependendo da importância dela na Internet. É possível solicitar que o Google rastreie uma página novamente usando a Ferramenta de inspeção de URL.

Se precisar remover uma página do seu site rapidamente dos resultados da pesquisa do Google, consulte a documentação sobre remoções.

Isso também pode acontecer quando o arquivo robots.txt bloqueia o URL dos rastreadores da Web do Google. Por esse motivo, não é possível ver a tag. Para desbloquear sua página do Google, é necessário editar o arquivo robots.txt.

Por fim, verifique se a regra noindex está visível para o Googlebot. Para testar se a implementação de noindex está correta, use a Ferramenta de inspeção de URL e confira o HTML recebido pelo Googlebot ao rastrear a página. Você também pode usar o Relatório de indexação de páginas no Search Console para monitorar as páginas do seu site que tiveram uma regra noindex extraída pelo Googlebot.

Bloquear a indexação da Pesquisa com noindex

Implementação de noindex

Tag <meta>

Cabeçalho de resposta HTTP

Como depurar de problemas de noindex

Bloquear a indexação da Pesquisa com `noindex`

Implementação de `noindex`

Tag `<meta>`

Como depurar de problemas de `noindex`