Kini, kami hadir di LinkedIn: Untuk mendapatkan berita dan referensi dari Google Penelusuran tentang cara membuat situs Anda dapat ditemukan, ikuti kami di LinkedIn.
Penjelasan Penghapusan URL, bagian II: Menghapus teks sensitif dari halaman
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Jumat, 6 Agustus 2010
Perubahan dapat terjadi—terkadang, seperti yang kita lihat di
postingan sebelumnya tentang penghapusan URL,
Anda dapat sepenuhnya memblokir atau menghapus halaman dari situs. Terkadang, Anda hanya dapat mengubah bagian
halaman, atau menghapus bagian teks tertentu. Bergantung pada seberapa sering halaman di-crawl,
perlu waktu beberapa saat sebelum perubahan ini tercermin di hasil penelusuran kami. Dalam postingan blog ini,
mari kita lihat langkah-langkah yang dapat dilakukan jika konten lama yang telah dihapus masih ditampilkan di hasil
penelusuran, baik dalam bentuk "cuplikan" maupun di halaman yang di-cache yang ditautkan dari hasil
penelusuran. Tindakan ini berguna jika konten lama tersebut berisi informasi sensitif yang harus
segera dihapus—Anda tidak perlu melakukan hal ini saat baru saja memperbarui situs seperti biasanya.
Sebagai contoh, mari kita lihat hasil penelusuran fiktif berikut:
Walter E. Coyote
< Judul
Chief Development Officer at Acme Corp 1948-2003: worked on the top
secret velocitus incalculii capturing device which has shown potential...
< Cuplikan
www.example.com/about/waltercoyote - Di-cache
< URL + link ke halaman yang di-cache
Untuk mengubah konten yang ditampilkan di cuplikan (atau di halaman tertaut yang di-cache),
Anda harus mengubah konten terlebih dahulu di halaman (aktif) sebenarnya. Kecuali jika konten halaman yang tersedia secara
publik diubah, proses otomatis Google akan terus menampilkan bagian
konten asli di hasil penelusuran kami.
Setelah konten halaman diubah, ada beberapa opsi yang tersedia agar perubahan tersebut
terlihat di hasil penelusuran kami:
Tunggu hingga Googlebot meng-crawl ulang dan mengindeks ulang halaman: Ini adalah metode pembaruan alami
untuk sebagian besar konten di Google. Proses ini terkadang dapat memakan waktu yang cukup lama, bergantung pada
seberapa sering saat ini Googlebot meng-crawl halaman yang dimaksud. Setelah kami meng-crawl ulang dan
mengindeks ulang halaman, konten lama biasanya tidak akan terlihat karena akan
diganti dengan konten yang saat ini ditampilkan. Jika Googlebot tidak diblokir untuk meng-crawl halaman yang dimaksud (baik
dengan robots.txt atau karena server tidak dapat diakses dengan benar), Anda tidak perlu melakukan
tindakan khusus untuk menyelesaikan proses ini. Umumnya, Anda tidak dapat mempercepat crawling dan
pengindeksan karena proses ini sepenuhnya otomatis dan bergantung pada banyak faktor eksternal.
Gunakan
alat penghapusan URL publik Google
untuk meminta penghapusan konten yang telah dihapus dari halaman web orang lain. Dengan
alat ini, Anda harus memasukkan
URL halaman spesifik
yang telah diubah, memilih opsi "Konten telah dihapus dari halaman", lalu
menetapkan satu atau beberapa kata yang telah dihapus sepenuhnya dari halaman tersebut.
Perhatikan bahwa tidak satu pun kata yang Anda masukkan boleh muncul di halaman; meskipun jika kata tersebut telah
dihapus dari satu bagian halaman, permintaan Anda akan ditolak jika kata tersebut masih muncul di
bagian halaman yang lain. Pastikan untuk memilih kata (atau beberapa kata) yang tidak lagi muncul
di bagian halaman mana pun. Jika, pada contoh di atas, Anda menghapus
"top secret velocitus incalculii capturing device", kirimkan
kata-kata tersebut dan bukan sesuatu seperti "project saya". Namun, jika kata
"top" atau "device" masih ada
di halaman, permintaan akan ditolak. Untuk memaksimalkan peluang keberhasilan,
sering kali, cara termudahnya adalah dengan hanya memasukkan satu kata yang Anda yakin tidak muncul lagi di bagian halaman mana pun.
Setelah permintaan Anda diproses dan diketahui bahwa kata yang dikirimkan tidak lagi
muncul di halaman tersebut, hasil penelusuran tidak akan lagi menampilkan cuplikan, dan halaman yang di-cache
juga tidak akan tersedia. Judul dan URL halaman akan tetap terlihat, dan entrinya mungkin masih
muncul di hasil penelusuran untuk penelusuran yang terkait dengan konten yang telah dihapus (seperti
penelusuran untuk
velocitus incalculii),
meskipun jika kata tersebut tidak muncul lagi di cuplikan. Namun, jika halaman sudah
di-crawl ulang dan diindeks ulang, halaman yang di-cache dan cuplikan baru akan terlihat di hasil
penelusuran kami.
Ingat bahwa kami harus melihat halaman untuk memverifikasi bahwa kata tersebut sudah dihapus. Jika
halaman sudah tidak ada dan server menampilkan
kode hasil HTTP 404 atau 410 sebagaimana mestinya,
sehingga kami tidak dapat melihat halaman, sebaiknya Anda
meminta penghapusan halaman
sepenuhnya.
Gunakan alat penghapusan URL Alat WebMaster Google untuk
meminta penghapusan informasi di halaman dari situs Anda. Jika Anda memiliki akses ke
situs yang dimaksud dan telah memverifikasi kepemilikannya di
Alat WebMaster Google,
Anda dapat menggunakan alat penghapusan URL di sana (di bagian
Konfigurasi Situs > Akses crawler) untuk meminta
agar cuplikan dan halaman yang di-cache dihapus hingga halaman di-crawl ulang. Untuk menggunakan
alat ini, Anda hanya perlu mengirimkan
URL halaman spesifik
(Anda tidak perlu menetapkan kata yang dihapus). Setelah permintaan Anda diproses, kami akan
menghapus cuplikan dan halaman yang di-cache dari hasil penelusuran. Judul dan URL halaman
akan tetap terlihat, dan halaman mungkin juga tetap mendapatkan peringkat di hasil penelusuran untuk kueri
terkait konten yang telah dihapus. Setelah halaman di-crawl ulang dan diindeks ulang,
hasil penelusuran dengan pembaruan cuplikan dan halaman yang di-cache (berdasarkan konten baru) akan
terlihat.
Google mengindeks dan memberi peringkat item tidak hanya berdasarkan konten halaman, tetapi juga berdasarkan faktor eksternal
lainnya, seperti link masuk ke URL. Oleh karena itu, URL mungkin
akan terus muncul di hasil penelusuran untuk konten yang tidak ada lagi di halaman tersebut, meskipun setelah
halaman di-crawl ulang dan diindeks ulang. Meskipun alat penghapusan URL dapat menghapus cuplikan
dan halaman yang di-cache dari hasil penelusuran, alat ini tidak akan mengubah atau menghapus judul hasil
penelusuran, mengubah URL yang ditampilkan, atau mencegah halaman ditampilkan untuk penelusuran berdasarkan
konten saat ini atau sebelumnya. Jika menurut Anda ini penting, harap pastikan bahwa URL
memenuhi persyaratan untuk
dihapus sepenuhnya dari hasil penelusuran kami.
Menghapus konten non-HTML
Jika konten yang diubah tidak dalam format (X)HTML (misalnya saat gambar, file Flash, atau file PDF
telah diubah), Anda tidak akan dapat menggunakan alat penghapusan cache. Jadi, jika konten lama
tidak perlu terlihat lagi di hasil penelusuran, solusi paling cepat adalah mengubah URL
file tersebut agar URL lama menampilkan kode hasil HTTP 404 dan menggunakan alat penghapusan URL
untuk menghapus URL lama. Atau, jika memilih untuk mengizinkan Google memperbarui informasi Anda
secara alami, perlu diketahui bahwa pratinjau konten non-HTML (seperti
link Lihat Detail untuk file PDF)
mungkin memakan waktu lebih lama untuk diperbarui setelah di-crawl ulang daripada halaman HTML biasa.
Secara proaktif mencegah cuplikan atau versi yang di-cache ditampilkan
Sebagai webmaster, Anda memiliki opsi untuk menggunakan
tag meta
robots guna secara proaktif mencegah cuplikan atau versi yang di-cache ditampilkan tanpa menggunakan alat
penghapusan kami. Meskipun kami tidak merekomendasikan cara ini sebagai pendekatan umum (cuplikan dapat membantu pengguna mengenali
hasil penelusuran yang relevan dengan lebih cepat, dan halaman yang di-cache memberi mereka kemampuan untuk melihat konten bahkan
jika ada kejadian tidak terduga saat server Anda tidak tersedia), Anda dapat menggunakan tag meta robots
"nosnippet" untuk
mencegah cuplikan ditampilkan,
atau tag metarobots "noarchive" untuk menonaktifkan cache halaman. Perhatikan bahwa jika setelan ini diubah di
halaman yang sudah ada dan yang diketahui, Googlebot perlu meng-crawl ulang dan mengindeks ulang halaman tersebut sebelum
perubahan ini terlihat di hasil penelusuran.
Semoga postingan blog ini membantu menjelaskan sedikit beberapa proses di balik alat penghapusan URL untuk halaman
yang diperbarui. Pada postingan blog berikutnya, kami akan membahas cara meminta penghapusan konten yang
bukan milik Anda; nantikan kabar selanjutnya!
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],[],[[["\u003cp\u003eGoogle's search results may display outdated content even after a webpage has been updated.\u003c/p\u003e\n"],["\u003cp\u003eTo update Google's search results, you can wait for Google to recrawl the page, or request removal of the outdated content through Google's URL removal tool.\u003c/p\u003e\n"],["\u003cp\u003eIf you own the website, use Google Webmaster Tools to remove the snippet and cached page until Google recrawls the updated page.\u003c/p\u003e\n"],["\u003cp\u003eGoogle's URL removal tool does not prevent a page from ranking based on previous content, so for complete removal, consider the requirements for removal from search results altogether.\u003c/p\u003e\n"],["\u003cp\u003eTo prevent snippets or cached versions from appearing, use robots meta tags, but it's generally recommended to keep them for user experience.\u003c/p\u003e\n"]]],["To update outdated content in Google search results, first modify the live page. Then, either wait for Googlebot to re-crawl and re-index or use Google's URL removal tools. There are two options for URL removals: removing content from others' pages by specifying removed words or removing information from your own page via Google Webmaster Tools, without specifying removed words. For non-HTML content, change the file's URL. Lastly, webmasters can proactively prevent snippets and cached versions using robots meta tags.\n"],null,["# URL removals explained, part II: Removing sensitive text from a page\n\nFriday, August 06, 2010\n\n\nChange can happen---sometimes, as we saw in our\n[previous post on URL removals](/search/blog/2010/03/url-removal-explained-part-i-urls),\nyou may completely block or remove a page from your site. Other times you might only change parts\nof a page, or remove certain pieces of text. Depending on how frequently a page is being crawled,\nit can take some time before these changes get reflected in our search results. In this blog post\nwe'll look at the steps you can take if we're still showing old, removed content in our search\nresults, either in the form of a \"snippet\" or on the cached page that's linked to from the search\nresult. Doing this makes sense when the old content contains sensitive information that needs to\nbe removed quickly---it's not necessary to do this when you just update a website normally.\n\nAs an example, let's look at the following fictitious search result:\n\n|---------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|\n| **Walter** E. **Coyote** | \\\u003c Title |\n| Chief Development Officer at Acme Corp 1948-2003: worked on the top secret velocitus incalculii capturing device which has shown potential**...** | \\\u003c Snippet |\n| www.example.com/about/**waltercoyote** - Cached | \\\u003c URL + link to cached page |\n\n\nTo change the content shown in the snippet (or on the linked cached page),\n**you'll first need to change the content on the actual (live) page**. Unless a page's publicly\nvisible content is changed, Google's automatic processes will continue to show parts of the\noriginal content in our search results.\n\n\nOnce the page's content has been changed, there are several options available to make those\nchanges visible in our search results:\n\n1.\n **Wait for Googlebot to re-crawl and re-index the page**: This is the natural method for\n how most content is updated at Google. Sometimes it can take a fairly long time, depending on\n how frequently Googlebot currently crawls the page in question. Once we've re-crawled and\n re-indexed the page, the old content will usually not be visible as it'll be replaced by the\n current content. Provided Googlebot is not blocked from crawling the page in question (either\n by robots.txt or by not being able to access the server properly), you don't have to do\n anything special for this to take place. It's generally not possible to speed up crawling and\n indexing, as these processes are fully automated and depend on many external factors.\n\n2.\n Use\n [Google's public URL removal tool](https://www.google.com/webmasters/tools/removals)\n to **request removal of content that has been removed from someone else's webpage** . Using\n this tool, it's necessary to enter the\n [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\n that has been modified, select the \"Content has been removed from the page\" option, and then\n specify one or more words that have been completely removed from that page.\n\n\n Note that *none* of the words you enter can appear on the page; even if a word has been\n removed from one part of the page, your request will be denied if that word still appears on\n another part of the page. Be sure to choose a word (or words) that no longer appear\n *anywhere* on the page. If, in the above example, you removed\n \"top secret velocitus incalculii capturing device\", you should\n submit those words and not something like \"my project.\" However, if the word\n \"top\" or \"device\" still exists\n anywhere on the page, the request would be denied. To maximize your chances of success, it's\n often easiest to just enter one word that you're sure no longer appears anywhere on the page.\n\n\n Once your request has been processed and it's found that the submitted word(s) no longer\n appear on the page, the search result will no longer show a snippet, nor will the cached page\n be available. The title and the URL of the page will still be visible, and the entry may still\n appear in search results for searches related to the content that has been removed (such as\n searches for\n [velocitus incalculii](https://www.google.com/search?q=velocitus+incalculii)),\n even if those words no longer appear in the snippet. However, once the page has been\n re-crawled and re-indexed, the new snippet and cached page can be visible in our search\n results.\n\n\n Keep in mind that we will need to verify removal of the word(s) by viewing the page. If the\n page no longer exists and the server is returning a proper\n [`404` or `410` HTTP result code](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes),\n making us unable to view the page, you may be better off\n [requesting removal of the page](/search/blog/2010/03/url-removal-explained-part-i-urls)\n altogether.\n3. Use Google Webmaster Tools URL removal tool to **request removal of information on a page from your website** . If you have access to the website in question and have verified ownership of it in [Google Webmaster Tools](https://search.google.com/search-console), you can use the URL removal tool there (under *Site Configuration \\\u003e Crawler access* ) to request that the snippet and the cached page be removed until the page has been re-crawled. To use this tool, you only need to submit the [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758) (you won't need to specify any removed words). Once your request has been processed, we'll remove the snippet and the cached page from search results. The title and the URL of the page will still be visible, and the page may also continue to rank in search results for queries related to content that has been removed. After the page has been re-crawled and re-indexed, the search result with an updated snippet and cached page (based on the new content) can be visible.\n\n\nGoogle indexes and ranks items based not only on the content of a page, but also on other external\nfactors, such as the inbound links to the URL. Because of this, it's possible for a URL to\ncontinue to appear in search results for content that no longer exists on the page, even after\nthe page has been re-crawled and re-indexed. While the URL removal tool can remove the snippet\nand the cached page from a search result, it will not change or remove the title of the search\nresult, change the URL that is shown, or prevent the page from being shown for searches based on\nany current or previous content. If this is important to you, you should make sure that the URL\nfulfills the requirements for a\n[complete removal from our search results](/search/blog/2010/03/url-removal-explained-part-i-urls).\n\nRemoving non-HTML content\n-------------------------\n\n\nIf the changed content is not in (X)HTML (for example if an image, a Flash file or a PDF file has\nbeen changed), you won't be able to use the cache removal tool. So if it's important that the old\ncontent no longer be visible in search results, the fastest solution would be to change the URL\nof the file so that the old URL returns a `404` HTTP result code and use the URL\nremoval tool to remove the old URL. Otherwise, if you chose to allow Google to naturally refresh\nyour information, know that previews of non-HTML content (such as\n[Quick View links for PDF files](https://googleblog.blogspot.com/2009/10/quickly-view-formatted-pdfs-in-your.html))\ncan take longer to update after recrawling than normal HTML pages would.\n\nProactively preventing the appearance of snippets or cached versions\n--------------------------------------------------------------------\n\n\nAs a webmaster, you have the option to use robots\n[`meta` tags](/search/docs/advanced/crawling/special-tags)\nto proactively prevent the appearance of snippets or cached versions without using our removal\ntools. While we don't recommend this as a default approach (the snippet can help users recognize a\nrelevant search result faster, and a cached page gives them the ability to view your content even\nin the unexpected event of your server not being available), you can use the \"nosnippet\" robots\n`meta` tag to\n[prevent showing of a snippet](/search/docs/crawling-indexing/robots-meta-tag#nosnippet),\nor the \"noarchive\" robots `meta` tag to disable caching of a page. Note that if this is changed on\nexisting and known pages, Googlebot will need to re-crawl and re-index those pages before this\nchange becomes visible in search results.\n\n\nWe hope this blog post helps to make some of the processes behind the URL removal tool for updated\npages a bit clearer. In our next blog post we'll look at ways to request removal of content that\nyou don't own; stay tuned!\n\n\nAs always, we welcome your feedback and questions in our\n[Webmaster Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7).\n\nOther posts of this series\n--------------------------\n\n- [Part I: Removing URLs and directories](/search/blog/2010/03/url-removal-explained-part-i-urls)\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nFinally, you might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\n\nPosted by\n[John Mueller](https://twitter.com/JohnMu),\nWebmaster Trends Analyst, Google Switzerland"]]