Wtorek, 30 marca 2010 roku
Obecnie w internecie jest wiele treści. W internecie może pojawić się coś, czego sobie nie życzysz. Może to być kontrowersyjny post na blogu, którego opublikowania żałujesz, albo informacje poufne, które zostały przypadkowo ujawnione. W większości przypadków usunięcie lub ograniczenie dostępu do tych treści zwykle po jakimś czasie spowoduje, że naturalnie znikną z wyników wyszukiwania. Jeśli jednak musisz pilnie usunąć niechciane treści, które zostały zindeksowane przez Google, i nie możesz doczekać się ich naturalnego zniknięcia, możesz użyć naszego narzędzia do usuwania adresów URL, aby przyspieszyć usuwanie treści z wyników wyszukiwania. Te treści muszą spełniać określone kryteria (omówimy je poniżej).
Przygotowaliśmy serię postów na blogu, z których dowiesz się, jak usuwać różne typy treści i jakich częstych błędów należy unikać. W pierwszym poście opiszę kilka podstawowych scenariuszy: usuwanie pojedynczego adresu URL, usuwanie całego katalogu lub witryny oraz ponowne uwzględnienie usuniętych treści. Zdecydowanie polecam też poprzedni post o zarządzaniu informacjami o Tobie dostępnymi w internecie.
Usuwanie pojedynczego adresu URL
Aby żądania usunięcia treści zostały zaakceptowane, właściciel adresów URL (niezależnie od tego, czy to Ty, czy inna osoba) musi zgodzić się na usunięcie treści. W przypadku pojedynczego adresu URL można to oznaczyć na 3 sposoby:
- zablokowanie indeksowania strony w pliku robots.txt;
-
zablokowanie indeksowania strony za pomocą
tagu
noindex
meta
; -
wskazanie, że strona już nie istnieje – w odpowiedzi zwracanie kodu stanu
404
lub410
.
Zanim prześlesz prośbę o usunięcie treści, możesz sprawdzić, czy adres URL jest prawidłowo zablokowany:
- robots.txt: używając funkcji Pobierz jako Googlebot lub Test pliku robots.txt w Narzędziach dla webmasterów możesz sprawdzić, czy URL jest prawidłowo zablokowany.
-
Tag
noindex
meta
: funkcja „Pobierz jako Googlebot” pozwala sprawdzić, czy tagmeta
znajduje się między tagami<head>
i</head>
. Jeśli chcesz sprawdzić stronę, której nie możesz zweryfikować w Narzędziach dla webmasterów, możesz otworzyć jej adres URL w przeglądarce: Widok>Źródło strony i upewnić się, że między tagami<head>
i</head>
jest tagmeta
. -
Kod stanu
404
i410
: możesz użyć narzędzia Pobierz jako Googlebot lub narzędzi takich jak nagłówki HTTP strony opublikowanej lub web-sniffer.net do sprawdzenia, czy adres URL zwraca właściwy kod. Czasami strony usunięte mogą mieć stan „404” lub „Nie znaleziono”, ale w rzeczywistości zwracają kod stanu200
w nagłówku strony. Dlatego dobrze jest użyć odpowiedniego narzędzia do sprawdzania nagłówków, aby dokładnie je sprawdzić.
Jeśli niechciane treści zostały usunięte ze strony, ale strona nie została zablokowana w sposób opisany powyżej, nie będziesz w stanie całkowicie usunąć danego adresu URL z wyników wyszukiwania. Najczęściej dzieje się tak, gdy witryna, w której dostępne są te treści, nie należy do Ciebie. O tym, co należy zrobić w takiej sytuacji, dowiesz się z kolejnego posta w części 2 naszej serii dotyczącej usuwania treści.
Jeśli URL spełnia jedno z powyższych kryteriów, możesz go usunąć. W tym celu otwórz Narzędzie do usuwania, wpisz URL, który chcesz usunąć, i wybierz opcję „Webmaster już zablokował tę stronę”. Pamiętaj, że musisz wpisać adres URL, pod którym treść była hostowana, a nie adres URL wyszukiwarki Google, w której się wyświetliła. Na przykład wpisz https://www.example.com/embarrassing-stuff.html
, a nie
https://www.google.com/search?q=embarrassing+stuff
.
W naszym artykule w Centrum pomocy znajdziesz więcej informacji o tym, jak upewnić się, że wpisujesz prawidłowy adres URL. Pamiętaj, że jeśli nie podasz nam adresu URL, który Cię niepokoi, nie będziemy mogli usunąć treści, o których mowa.
Usuwanie całego katalogu lub witryny
Aby usunąć treści z katalogu lub całej witryny, musisz zablokować katalog lub witrynę w pliku robots.txt witryny. Aby na przykład usunąć katalog https://www.example.com/secret/
, plik robots.txt musi zawierać:
User-agent: * Disallow: /secret/
Nie wystarczy, aby katalog główny zwrócił kod stanu 404
, ponieważ katalog może zwracać kod 404
, ale nadal wyświetlać pliki, które są poniżej.
Użycie pliku robots.txt do zablokowania katalogu (lub całej witryny) powoduje też, że zostaną zablokowane wszystkie adresy URL w tym katalogu (lub witrynie). Aby sprawdzić, czy katalog został poprawnie zablokowany, użyj narzędzia Pobierz jako Googlebot lub Test pliku robots.txt. w Narzędziach dla webmasterów.
Tylko zweryfikowani właściciele witryny mogą poprosić o usunięcie całej witryny lub katalogu w Narzędziach dla webmasterów. Aby poprosić o usunięcie katalogu lub witryny, kliknij daną witrynę i wybierz Konfiguracja witryny>Dostęp dla robota>Usuń URL. Jeśli jako główny adres URL chcesz podać katalog główny witryny, pojawi się prośba o potwierdzenie, że chcesz usunąć całą witrynę. Jeśli wpiszesz podkatalog, wybierz opcję „Usuń katalog” z menu.
Ponowne uwzględnianie treści
W każdej chwili możesz anulować prośbę o usunięcie dowolnej ze swoich witryn, także tych przesłanych przez inne osoby. Aby to zrobić, musisz być zweryfikowanym właścicielem tej witryny w Narzędziach dla webmasterów. Gdy potwierdzisz własność, możesz przejść do strony: Konfiguracja witryny>Dostęp dla robota>Usuń URL>Usunięte adresy URL (lub > Utworzone przez innych) i kliknij „Anuluj” obok próśb, które chcesz anulować.
Nadal masz pytania? W kolejnych filmach z tej serii dowiesz się, jak usunąć treści z wyników wyszukiwania Google. Jeśli nie możesz czekać, na naszym Forum pomocy znajdziesz wiele informacji na temat usuwania adresów URL i rozwiązywania poszczególnych problemów. Jeśli po przeczytaniu opinii innych użytkowników nadal masz jakieś pytania, możesz zapytać. W większości przypadków trudno jest udzielić odpowiedniej porady dotyczącej konkretnego usunięcia, nie znając witryny lub adresu URL, o którym mowa. Zalecamy udostępnienie adresu URL za pomocą usługi skracania adresów URL, aby nie mógł on zostać zindeksowany w ramach Twojego posta. Usługi skracające mogą nawet wyłączyć skrót, gdy problem zostanie rozwiązany.
Inne posty z tej serii
- Część 2. Usuwanie i aktualizowanie treści z pamięci podręcznej
- Część 3. Usuwanie treści, które należą do kogoś innego
- Część 4. Śledzenie żądań i określanie, czego nie usuwać
Warto też przeczytać artykuł o zarządzaniu informacjami o sobie dostępnymi w internecie.