Blokowanie indeksowania przez wyszukiwarki za pomocą tagu `noindex`

noindex to reguła ustawiona za pomocą tagu <meta> lub nagłówka odpowiedzi HTTP, która służy do zapobiegania indeksowaniu treści przez wyszukiwarki, które obsługują regułę noindex (np. Google). Kiedy podczas indeksowania Googlebot wyodrębni ten tag lub nagłówek, całkowicie wyeliminuje stronę z wyników wyszukiwania Google niezależnie od tego, czy w innych witrynach znajdują się prowadzące do niej linki.

Ważne: aby reguła noindex działała poprawnie, nie możesz blokować strony lub zasobu w pliku robots.txt ani w żaden inny sposób uniemożliwiać robotowi dostępu do strony lub zasobu. Jeśli zablokujesz stronę w pliku robots.txt lub będzie ona niedostępna dla robota, nie odnajdzie on reguły noindex i możliwe, że strona będzie się w dalszym ciągu wyświetlać w wynikach wyszukiwania, np. gdy linki do niej będą występowały na innych stronach.

Dyrektywa noindex pozwala kontrolować dostęp do poszczególnych stron witryny i przydaje się, gdy nie masz dostępu do katalogu głównego serwera.

Stosowanie dyrektywy `noindex`

Są 2 sposoby stosowania dyrektywy noindex: w postaci tagu <meta> oraz jako nagłówka odpowiedzi HTTP. Dają one taki sam efekt, więc wybierz metodę, którą łatwiej zastosować w Twojej witrynie i która lepiej pasuje do Twojego typu treści. Określenie reguły noindex w pliku robots.txt nie jest obsługiwane przez Google.

Możesz też połączyć regułę noindex z innymi regułami kontrolującymi indeksowanie. Możesz na przykład połączyć podpowiedź nofollow z regułą noindex: <meta name="robots" content="noindex, nofollow" />.

Tag `<meta>`

Aby zapobiec indeksowaniu pewnej strony z Twojej witryny przez wszystkie wyszukiwarki, które obsługują regułę noindex, umieść w sekcji <head> danej strony ten tag <meta>:

<meta name="robots" content="noindex">

Aby zapobiec indeksowaniu strony tylko przez roboty Google:

<meta name="googlebot" content="noindex">

Pamiętaj, że niektóre wyszukiwarki mogą interpretować regułę noindex inaczej. W efekcie w innych wyszukiwarkach strona może wciąż pojawiać się w wynikach wyszukiwania.

Więcej informacji o tagu noindex <meta>

Nagłówek odpowiedzi HTTP

Zamiast tagu <meta> możesz w odpowiedzi zwrócić nagłówek HTTP X-Robots-Tag z wartością noindex lub none. Nagłówka odpowiedzi możesz użyć w przypadku zasobów w formacie innym niż HTML, takich jak pliki PDF, pliki wideo lub pliki graficzne. Przykładowa odpowiedź HTTP z nagłówkiem X-Robots-Tag informującym wyszukiwarki, że mają nie indeksować strony, wygląda tak:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Więcej informacji o nagłówku odpowiedzi z dyrektywą noindex

Debugowanie problemów `noindex`

Aby zobaczyć tagi <meta> i nagłówki HTTP, musimy najpierw zindeksować Twoją stronę. Jeśli strona nadal pojawia się w wynikach wyszukiwania, dzieje się tak prawdopodobnie dlatego, że nie zindeksowaliśmy jej od czasu dodania reguły noindex. W zależności od znaczenia strony w internecie może minąć kilka miesięcy, zanim Googlebot ponownie ją odwiedzi. Możesz poprosić Google o ponowne zindeksowanie strony za pomocą narzędzia do sprawdzania adresów URL.

Jeśli musisz szybko usunąć stronę witryny z wyników wyszukiwania Google, przeczytaj dokumentację dotyczącą usuwania treści.

Powodem może też być to, że plik robots.txt blokuje robotom indeksującym Google dostęp do danego adresu URL, co uniemożliwia im znalezienie tagu. Aby odblokować Google dostęp do strony, musisz wprowadzić zmiany w pliku robots.txt.

Na koniec upewnij się, że reguła noindex jest widoczna dla Googlebota. Aby sprawdzić, czy implementacja noindex jest prawidłowa, użyj narzędzia do sprawdzania adresów URL. Pozwoli to zobaczyć kod HTML, który Googlebot zeskanował w trakcie indeksowania strony. Możesz też skorzystać z raportu Indeksowanie stron w Search Console, aby monitorować strony w witrynie, z których Googlebot wyodrębnił regułę noindex.

Blokowanie indeksowania przez wyszukiwarki za pomocą tagu noindex

Stosowanie dyrektywy noindex

Tag <meta>

Nagłówek odpowiedzi HTTP

Debugowanie problemów noindex

Blokowanie indeksowania przez wyszukiwarki za pomocą tagu `noindex`

Stosowanie dyrektywy `noindex`

Tag `<meta>`

Debugowanie problemów `noindex`