Impedir que la Búsqueda indexe páginas con la directiva `noindex`

noindex es una regla que se configura con una etiqueta <meta> o con un encabezado de respuesta HTTP, y que sirve para impedir que los buscadores que admiten la regla noindex, como Google, indexen contenido. Así, cuando el robot de Google rastrea una página y extrae la etiqueta o el encabezado, Google la retira de los resultados de la Búsqueda aunque otros sitios tengan enlaces a ella.

Importante: Para que la regla noindex surta efecto, la página o el recurso en cuestión no debe haberse bloqueado mediante un archivo robots.txt ni ningún otro mecanismo que impida al rastreador acceder a ellos. Si el rastreador no puede acceder, no verá la regla noindex, por lo que la página podrá seguir apareciendo en los resultados de búsqueda, por ejemplo si otras páginas tienen enlaces a ella.

La directiva noindex es útil si no tienes acceso raíz a tu servidor, ya que te permite controlar el acceso a tu sitio a nivel de página.

Implementar `noindex`

Puedes implementar noindex de dos formas: como etiqueta <meta> o como encabezado de respuesta HTTP. Ambos métodos tienen el mismo efecto, así que elige el que mejor se adapte a tu sitio y a tu tipo de contenido. Google no admite que se especifique la regla noindex en el archivo robots.txt.

También puedes combinar la regla noindex con otras reglas que controlan la indexación. Por ejemplo, puedes unir una indicación nofollow con una regla noindex: <meta name="robots" content="noindex, nofollow" />.

Etiqueta `<meta>`

Para impedir que todos los buscadores que admiten la regla noindex indexen una página de tu sitio, coloca la etiqueta <meta> siguiente en la sección <head> de tu página:

<meta name="robots" content="noindex">

Si solo quieres impedir que lo hagan los rastreadores web de Google, incluye esta otra etiqueta meta:

<meta name="googlebot" content="noindex">

Es posible que algunos buscadores interpreten la regla noindex de otra forma, por lo que puede que tu página siga apareciendo en sus resultados.

Consulta más información sobre la etiqueta <meta> noindex.

Encabezado de respuesta HTTP

En lugar de una etiqueta <meta>, puedes devolver un encabezado HTTP X-Robots-Tag con el valor noindex o none en tu respuesta. Un encabezado de respuesta puede usarse en recursos que no sean HTML (como archivos PDF, de vídeo y de imagen). A continuación, se muestra un ejemplo de una respuesta HTTP con un encabezado X-Robots-Tag que indica a los buscadores que no indexen una página:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Consulta más información sobre el encabezado de respuesta noindex.

Depurar problemas de `noindex`

Para ver las etiquetas <meta> y los encabezados HTTP de tu página, primero tenemos que rastrearla. Por tanto, si una página sigue apareciendo en los resultados, probablemente sea porque no la hemos rastreado desde que añadiste la regla noindex. En función de la importancia de la página en Internet, el robot de Google puede tardar meses en volver a visitarla. Puedes solicitar que Google vuelva a rastrear una página con la herramienta de inspección de URLs.

Si necesitas retirar rápidamente una página de tu sitio de los resultados de búsqueda de Google, consulta nuestra documentación sobre retiradas.

También puede ser que el archivo robots.txt esté bloqueando el acceso de los rastreadores web de Google a esa URL y que por eso no puedan ver la etiqueta. Para desbloquear tu página y que Google pueda acceder a ella, modifica el archivo robots.txt.

Por último, asegúrate de que el robot de Google pueda ver la regla noindex. Para comprobar si tu implementación de noindex es correcta, usa la herramienta de inspección de URLs para ver el código HTML que ha recibido el robot de Google al rastrear la página. También puedes usar el informe "Indexación de páginas" de Search Console para monitorizar las páginas de tu sitio de las que el robot de Google ha extraído una regla noindex.

Impedir que la Búsqueda indexe páginas con la directiva noindex

Implementar noindex

Etiqueta <meta>

Encabezado de respuesta HTTP

Depurar problemas de noindex

Impedir que la Búsqueda indexe páginas con la directiva `noindex`

Implementar `noindex`

Etiqueta `<meta>`

Depurar problemas de `noindex`