Especificações de metatag robots, data-nosnippet e X-Robots-Tag
Este documento explica como as configurações da página e do texto podem ser usadas para ajustar a forma como o Google
apresenta seu conteúdo nos resultados da pesquisa. Você pode especificar configurações da página incluindo uma metatag em páginas
HTML ou em um cabeçalho HTTP. Também é possível especificar configurações no nível do texto usando o atributo
data-nosnippet
nos elementos HTML de uma página.
Essas configurações só poderão ser lidas e seguidas se os rastreadores tiverem permissão para acessar as páginas que as incluem.
A tag ou
a diretiva <meta name="robots" content="noindex">
se aplica aos rastreadores dos mecanismos de pesquisa. Para bloquear os rastreadores que não são de pesquisa, como
AdsBot-Google
, pode ser necessário adicionar diretivas segmentadas ao rastreador específico
(por exemplo,
<meta name="AdsBot-Google" content="noindex">
).
Como usar a metatag robots
A metatag robots permite usar uma abordagem detalhada e específica da página para controlar a indexação e a exibição de uma
página individual aos usuários nos resultados da Pesquisa Google. Posicione a
metatag robots na seção <head>
de uma determinada página
assim:
<!DOCTYPE html> <html><head> <meta name="robots" content="noindex"> (…) </head> <body>(…)</body> </html>
Neste exemplo, a metatag robots instrui os mecanismos de pesquisa a não mostrar a página
nos resultados da pesquisa. O valor do atributo name
(robots
)
especifica que a diretiva é aplicada a todos os rastreadores. Para
gerenciar um rastreador específico, substitua o valor robots
do atributo
name
pelo nome do rastreador que está sendo
abordado. Rastreadores específicos também são conhecidos como user agents (um rastreador usa o user agent para
solicitar uma página). O rastreador da Web padrão do Google tem o nome de user agent
Googlebot
. Para impedir somente o Google de indexar sua página,
atualize a tag da seguinte forma:
<meta name="googlebot" content="noindex">
Esta tag agora instrui o Google a não exibir especificamente essa página nos resultados da pesquisa. Os
atributos name
e content
não diferenciam
maiúsculas de minúsculas.
Os mecanismos de pesquisa podem ter diferentes rastreadores para efeitos distintos. Veja a lista completa de rastreadores do Google. Por exemplo, para exibir uma página nos resultados da pesquisa na Web do Google, mas não no Google Notícias, use a seguinte metatag:
<meta name="googlebot-news" content="noindex">
Para especificar vários rastreadores individualmente, use diversas metatags robots:
<meta name="googlebot" content="noindex"> <meta name="googlebot-news" content="nosnippet">
Para bloquear a indexação de recursos não HTML, como arquivos PDF, de vídeo ou de imagem,
use o cabeçalho de resposta X-Robots-Tag
.
Como usar o cabeçalho HTTP X-Robots-Tag
O X-Robots-Tag
pode ser usado como um elemento da resposta do cabeçalho HTTP
para um determinado URL. Qualquer diretiva que possa ser usada em uma metatag robots também pode ser
especificada como X-Robots-Tag
. Veja um exemplo de uma resposta HTTP
com um X-Robots-Tag
que instrui os rastreadores a não indexar
uma página:
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noindex (…)
É possível combinar vários cabeçalhos X-Robots-Tag
na resposta
HTTP ou especificar uma lista de diretivas separadas por vírgulas. Veja um exemplo de resposta de cabeçalho
HTTP com uma X-Robots-Tag
noarchive
combinada a uma
X-Robots-Tag
unavailable_after
.
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)
A X-Robots-Tag
pode, opcionalmente, especificar um user agent antes das
diretivas. Por exemplo, o conjunto de cabeçalhos HTTP X-Robots-Tag
a seguir pode ser usado para permitir a exibição condicional de uma página nos
resultados da pesquisa em diferentes mecanismos:
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: googlebot: nofollow X-Robots-Tag: otherbot: noindex, nofollow (…)
As diretivas especificadas sem um user agent são válidas para todos os rastreadores. O cabeçalho HTTP, o nome do user agent e os valores especificados não diferenciam maiúsculas de minúsculas.
Diretivas válidas de indexação e exibição
As diretivas a seguir, também disponíveis em
formato legível por máquina, podem ser usadas para
controlar a indexação e a exibição de um snippet com
a metatag robots e a X-Robots-Tag
. Cada valor representa uma diretiva
específica. Várias diretivas podem ser combinadas em uma lista separada
por vírgulas ou em metatags separadas. Essas diretivas não diferenciam maiúsculas de minúsculas.
Diretivas | |
---|---|
|
Não há restrições para a indexação nem para a exibição. Essa diretiva é o valor padrão e não terá efeito se for listada explicitamente. |
|
Não mostrar esta página, mídia ou recurso nos resultados da pesquisa. Se você não especificar essa diretiva, a página, a mídia ou o recurso poderá ser indexado e exibido nos resultados da pesquisa. Para remover informações do Google, siga o guia explicativo. |
|
Não seguir os links nesta página. Se você não especificar essa diretiva, o Google poderá usar
os links na página para descobrir essas páginas vinculadas. Saiba mais sobre
nofollow .
|
|
É equivalente a noindex, nofollow .
|
|
Não exibir um link em cache nos resultados da pesquisa. Se você não especificar essa diretiva, o Google poderá gerar uma página em cache, que poderá ser acessada nos resultados da pesquisa. |
|
Não exibir uma caixa de pesquisa de sitelinks nos resultados de pesquisa da página. Se você não especificar essa diretiva, o Google poderá gerar uma caixa de pesquisa específica para seu site nos resultados da pesquisa, além de outros links diretos para o site. |
|
Não exibir um snippet de texto ou uma visualização de vídeo nos resultados da pesquisa para esta página. Uma miniatura de imagem estática (se disponível) continuará visível se essa opção resultar em uma melhor experiência do usuário. Isso será aplicado a todas as formas de resultados da pesquisa (na Pesquisa Google na Web, no Imagens do Google e no Discover). Se você não especificar essa diretiva, o Google poderá gerar um snippet de texto e uma visualização de vídeo com base nas informações encontradas na página. |
|
O Google tem permissão para indexar o conteúdo de uma página quando ela está incorporada em outra
por
|
|
Usar no máximo [number] caracteres como um snippet textual para esse resultado da pesquisa. Um URL pode aparecer várias vezes em uma página de resultados da pesquisa. Isso não afeta as visualizações de imagens nem de vídeos. Isso será aplicado a todas as formas de resultados da pesquisa (como Pesquisa Google na Web, Imagens do Google, Discover e Google Assistente). No entanto, esse limite não será aplicado nos casos em que um editor conceder permissão para o uso de conteúdo separadamente. Por exemplo, se o editor fornecer conteúdo na forma de dados estruturados in-page ou tiver um contrato de licença com o Google, essa configuração não interromperá esses usos mais específicos. Essa diretiva será ignorada se nenhum [number] for especificado. Se você não especificar essa diretiva, o Google escolherá o tamanho do snippet. Valores especiais:
Exemplo: Para interromper a exibição de um snippet nos resultados da pesquisa: <meta name="robots" content="max-snippet:0"> Para exibir até 20 caracteres no snippet: <meta name="robots" content="max-snippet:20"> Para especificar que não há limite para o número de caracteres que podem ser exibidos no snippet: <meta name="robots" content="max-snippet:-1"> |
|
Definir o tamanho máximo de uma visualização de imagem para esta página em um resultado da pesquisa.
Se você não especificar a diretiva Valores de [setting] aceitos:
Isso será aplicado a todas as formas de resultados da pesquisa (como Pesquisa Google na Web, Imagens do Google, Discover e Google Assistente). No entanto, esse limite não será aplicado nos casos em que um editor conceder permissão para o uso de conteúdo separadamente. Por exemplo, se o editor fornecer conteúdo na forma de dados estruturados in-page (como AMP ou versões canônicas de um artigo) ou tiver um contrato de licença com o Google, essa configuração não interromperá esses usos mais específicos.
Se você não quiser que o Google use imagens em miniatura maiores quando as páginas AMP e
versões canônicas de um artigo forem exibidas na Pesquisa ou no Discover, especifique um
valor de Exemplo: <meta name="robots" content="max-image-preview:standard"> |
|
Usar no máximo [number] segundos como snippet para vídeos desta página nos resultados da pesquisa.
Se você não especificar a diretiva Valores especiais:
Isso será aplicado a todas as formas de resultados da pesquisa (na Pesquisa Google na Web, no Imagens do Google, no Google Videos, no Discover e no Google Assistente). Essa diretiva será ignorada se nenhum [number] for especificado. Exemplo: <meta name="robots" content="max-video-preview:-1"> |
|
Não oferecer tradução desta página nos resultados da pesquisa. Se você não especificar essa diretiva, o Google talvez forneça uma tradução do link de título e snippet de um resultado da pesquisa para resultados que não estejam no idioma da consulta de pesquisa. Se o usuário clicar no link de título traduzido, todas as outras interações dele com a página serão feitas pelo Google Tradutor, que traduz automaticamente os links seguidos. |
|
Não indexar imagens nesta página. Se você não especificar esse valor, as imagens na página poderão ser indexadas e exibidas nos resultados da pesquisa. |
|
Não exibir esta página nos resultados da pesquisa após a data/hora especificada. A data/hora precisa ser especificada em um formato amplamente utilizado, o que inclui, entre outros, RFC 822, RFC 850 e ISO 8601. A diretiva será ignorada se não for especificada uma data/hora válida. Por padrão, não há data de validade para o conteúdo. Se você não especificar essa diretiva, a página talvez seja exibida nos resultados da pesquisa indefinidamente. O Googlebot vai diminuir a taxa de rastreamento do URL consideravelmente após a data e a hora especificadas. Exemplo: <meta name="robots" content="unavailable_after: 2020-09-21"> |
Tratamento de diretivas de indexação e exibição combinadas
É possível criar uma instrução de multidiretivas combinando diretivas de metatags robots com vírgulas ou usando várias metatags. Veja um exemplo de metatag robots que instrui os rastreadores da Web a não indexar a página e não rastrear quaisquer links na página:
Lista separada por vírgulas
<meta name="robots" content="noindex, nofollow">
Várias metatags
<meta name="robots" content="noindex"> <meta name="robots" content="nofollow">
Veja um exemplo que limita o snippet de texto a 20 caracteres e permite uma visualização de imagem grande:
<meta name="robots" content="max-snippet:20, max-image-preview:large">
Para situações em que vários rastreadores são especificados com diretivas diferentes, o mecanismo de pesquisa usará a soma das diretivas negativas. Exemplo:
<meta name="robots" content="nofollow"> <meta name="googlebot" content="noindex">
A página que contém essas metatags será interpretada como proprietária de
uma diretiva noindex, nofollow
ao ser rastreada pelo Googlebot.
Como usar o atributo HTML data-nosnippet
Você pode determinar que partes textuais de uma página HTML não sejam usadas como snippet. Isso pode ser feito em
um elemento HTML com o atributo HTML data-nosnippet
nos
elementos span
,
div
e
section
. O data-nosnippet
é considerado um
atributo booleano.
Como acontece com todos os atributos booleanos, qualquer valor especificado é ignorado. Para garantir a legibilidade pelas máquinas,
é preciso que a seção tenha HTML válido e todas as tags sejam fechadas corretamente.
Exemplo:
<p>This text can be shown in a snippet <span data-nosnippet>and this part would not be shown</span>.</p> <div data-nosnippet>not in snippet</div> <div data-nosnippet="true">also not in snippet</div> <div data-nosnippet="false">also not in snippet</div> <!-- all values are ignored --> <div data-nosnippet>some text</html> <!-- unclosed "div" will include all content afterwards --> <mytag data-nosnippet>some text</mytag> <!-- NOT VALID: not a span, div, or section -->
Normalmente, o Google processa páginas para indexação, mas a renderização não é garantida.
Por isso, a extração de data-nosnippet
pode acontecer antes e depois
da renderização. Para evitar problemas na renderização, não adicione nem remova o
atributo data-nosnippet
dos nós existentes pelo JavaScript.
Ao adicionar elementos DOM da página usando JavaScript, inclua o
atributo data-nosnippet
conforme necessário. Ao usar elementos personalizados, envolva ou renderize-os com elementos
div
, span
ou
section
, caso seja necessário incluir
data-nosnippet
.
Como usar dados estruturados
As metatags robots controlam a quantidade de conteúdo que o Google extrai automaticamente das páginas da Web
para exibição como resultados da pesquisa. Porém, muitos editores também usam dados estruturados
do schema.org para disponibilizar informações específicas para
apresentações de pesquisa. As limitações da metatag
robots não afetam o uso desses dados estruturados, exceto pelos valores
article.description
e
description
especificados para outros
trabalhos de criativos. Para especificar o comprimento máximo de uma visualização com base nesses valores
description
, use a metatag robots
max-snippet
. Por exemplo,
os dados estruturados recipe
de uma página serão incluídos no
carrossel de receitas, mesmo que a visualização do texto seja limitada. É possível limitar o tamanho
de uma visualização de texto com max-snippet
, mas a metatag
robots não se aplicará quando as informações forem fornecidas nos dados estruturados para pesquisa aprimorada.
Para gerenciar o uso de dados estruturados nas suas páginas da Web, modifique os tipos de dados estruturados e
valores propriamente ditos, adicionando ou removendo informações a fim de fornecer somente o conteúdo que deve
ser disponibilizado. Os dados estruturados ainda podem ser usados para resultados da pesquisa quando
declarados em um elemento data-nosnippet
.
Implementação prática de X-Robots-Tag
Você pode adicionar o X-Robots-Tag
às respostas HTTP de um site nos
arquivos de configuração do software do servidor da Web do seu site. Por exemplo, em servidores
da Web baseados em Apache, você pode usar arquivos .htaccess e httpd.conf. A vantagem de usar um
X-Robots-Tag
com respostas HTTP é que isso possibilita especificar
diretivas de rastreamento que são aplicadas globalmente em um site. O suporte a expressões regulares possibilita
um alto grau de flexibilidade.
Por exemplo, para adicionar uma X-Robots-Tag
noindex, nofollow
à resposta HTTP em todos os arquivos .PDF do
site, adicione o snippet a seguir ao arquivo raiz .htaccess ou httpd.conf no
Apache ou ao arquivo de configuração do site no NGINX.
Apache
<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow" </Files>
location ~* \.pdf$ { add_header X-Robots-Tag "noindex, nofollow"; }
NGINX
Use X-Robots-Tag
para arquivos não HTML, como arquivos de imagem,
em que o uso de metatags robots em HTML não é possível. Veja um exemplo de adição de uma diretiva
X-Robots-Tag
noindex
para
arquivos de imagens (.png, .jpeg, .jpg e .gif) em todo o site:
Apache
<Files ~ "\.(png|jpe?g|gif)$"> Header set X-Robots-Tag "noindex" </Files>
NGINX
location ~* \.(png|jpe?g|gif)$ { add_header X-Robots-Tag "noindex"; }
Também é possível definir o cabeçalho X-Robots-Tag
de cada arquivo estático:
Apache
# the htaccess file must be placed in the directory of the matched file. <Files "unicorn.pdf"> Header set X-Robots-Tag "noindex, nofollow" </Files>
NGINX
location = /secrets/unicorn.pdf { add_header X-Robots-Tag "noindex, nofollow"; }
Combinar diretivas robots.txt com diretivas de indexação e exibição
As metatags robots e os cabeçalhos HTTP X-Robots-Tag
são detectados quando
um URL é rastreado. Se uma página não tiver permissão para rastrear o arquivo robots.txt, nenhuma
informação sobre diretivas de indexação ou exibição será encontrada e, assim,
será ignorada. Se as diretivas de indexação ou exibição precisarem ser seguidas, os URLs com essas
diretivas não poderão ter o rastreamento proibido.