Cara agar informasi yang disamarkan tidak masuk ke Google Penelusuran

Saat memublikasikan dokumen dan gambar di web, Anda mungkin tidak sengaja memublikasikan informasi yang tidak mudah terlihat oleh mata manusia. Khususnya, informasi yang mungkin tidak Anda lihat, atau yang dimaksudkan untuk disamarkan, mungkin disertakan dalam beberapa format dokumen dan dapat dilihat di mesin telusur.

Konten yang tidak sepenuhnya disamarkan berpotensi dapat ditemukan di mesin telusur karena materi yang diindeks di dalamnya merupakan materi yang bersifat publik di web, termasuk gambar. Teknologi pendukung seperti pembaca layar dapat membuat konten yang tampaknya "tersembunyi" ini lebih mudah diakses, dan teknik pemahaman gambar umum seperti pengenalan karakter optik (OCR) juga membuat konten ini dapat ditelusuri.

Meskipun Anda dapat membuat teks tidak terlihat oleh mata manusia dengan cara mengatur teks dalam font kecil, menggunakan warna font yang sama dengan latar belakang teks, atau menutupi teks dengan gambar, metode tersebut tidak benar-benar menyunting materi sedemikian rupa sehingga mencegah mesin telusur mengindeksnya dan membuatnya dapat ditemukan.

Demikian pula, beberapa jenis dokumen menyertakan informasi dengan berbagai cara yang tidak terlihat langsung. Jenis dokumen tersebut mungkin menyertakan histori perubahan dokumen, sehingga pengguna dapat melihat teks yang telah disamarkan atau diubah. Jenis dokumen tersebut mungkin memiliki versi lengkap gambar yang berisi informasi yang dipotong atau disamarkan. Mungkin juga ada metadata yang disertakan dalam file, dan tidak terlihat langsung, yang mungkin mencantumkan nama pengakses atau pengedit file.

Semua informasi ini dapat tetap ada meskipun dokumen diekspor atau dikonversi dari satu format ke format lainnya. Jika Anda perlu menghapus informasi dari suatu file, hapus informasi tersebut sepenuhnya dari file sebelum dipublikasikan.

Berikut beberapa praktik terbaik untuk menyamarkan informasi dengan benar dari dokumen yang tidak ingin diindeks dan dapat ditemukan di Google Penelusuran.

Mengedit dan mengekspor gambar sebelum menyematkannya

Google Penelusuran akan mencantumkan gambar yang ditemukannya di seluruh web, baik yang ada di halaman maupun yang disematkan ke berbagai format dokumen. Gambar tersemat terkadang hanya diedit menggunakan alat pengeditan bawaan yang ada di dokumen. Hal ini dapat menyebabkan gagalnya penyamaran saat gambar diindeks terpisah dari dokumen. Oleh karena itu, sebaiknya edit gambar sebelum menyematkannya ke dokumen, bukan setelahnya. Khususnya:

Potong informasi yang tidak diinginkan dari gambar sebelum menyematkannya ke dokumen. Beberapa alat pengeditan dokumen (seperti pemroses kata atau alat pembuat slide) akan mempertahankan semua versi lengkap gambar yang Anda gunakan di dokumen versi publik, jadi pastikan untuk meninjau dokumentasi alat secara menyeluruh.
Hapus sepenuhnya atau kaburkan semua teks atau bagian non-publik lainnya dari gambar, karena sistem OCR dapat mengubah teks gambar apa pun yang terlihat menjadi teks yang dapat ditelusuri.
Hapus semua metadata yang tidak diinginkan.

Setelah mengikuti saran dalam dokumen ini, ekspor atau simpan gambar yang diperbarui sebagai format file gambar non-vektor atau yang dikompresi seperti PNG atau WEBP. Hal ini bertujuan agar bagian gambar tersebut tidak disertakan tanpa sengaja dalam dokumen publik.

Mengedit atau menghapus teks yang tidak diinginkan sebelum berpindah ke format file publik

Sebelum Anda membuat dokumen publik, hapus semua teks yang tidak ingin ditampilkan di versi akhir file. Anda dapat menggunakan format publik yang tidak menyimpan histori perubahan sebelumnya. Berikut tips yang lebih spesifik:

Gunakan alat penyamaran dokumen yang tepat jika informasi pada file perlu disamarkan. Misalnya, jangan gunakan persegi panjang hitam di atas teks sebagai metode penyamaran, karena dengan cara ini, teks masih dapat disertakan dalam dokumen publik.
Periksa kembali metadata dokumen di file publik.
Ikuti praktik terbaik penyamaran dokumen untuk format yang Anda gunakan (PDF, gambar, dll.).
Berhati-hatilah dengan informasi yang ada di URL atau nama file. Meskipun sebagian situs diblokir oleh robots.txt, URL dapat diindeks dalam penelusuran (tanpa kontennya). Gunakan hash dalam parameter URL, bukan nama atau alamat email.
Sebaiknya gunakan autentikasi untuk membatasi akses ke konten yang disamarkan. Tayangkan halaman login yang dihasilkan dengan tag meta robots noindex untuk memblokir pengindeksan.
Saat memublikasikan dokumen, pastikan situs sudah terverifikasi di Google Search Console. Dengan demikian, dokumen dapat cepat dihapus jika diperlukan.

Yang harus dilakukan jika dokumen yang tidak disamarkan atau disamarkan dengan tidak benar terindeks di Penelusuran

Hapus dokumen yang telah ditayangkan dari situs atau lokasi tempat Anda memublikasikannya.
Gunakan Alat penghapusan untuk situs terverifikasi guna menghapus dokumen yang dipermasalahkan dari Penelusuran. Gunakan awalan URL jika Anda perlu menghapus banyak dokumen. Untuk situs terverifikasi, penghapusan URL biasanya memerlukan waktu kurang dari sehari. Hal ini bertujuan agar dokumen yang dipermasalahkan tidak muncul setiap kali ada penelusuran untuk konten yang telah disamarkan.
Hosting dokumen yang telah disamarkan dengan benar di URL berbeda. Ini akan memastikan bahwa versi yang baru diindeks berisi dokumen baru, bukan versi lama (karena proses crawling ulang dan pembaruan URL dalam indeks penelusuran perlu waktu agak lama). Perbarui semua link yang mengarah ke dokumen tersebut.
Hubungi situs lain yang mungkin juga menghosting dokumen yang tidak disamarkan dengan benar dan minta situs tersebut untuk menghapusnya juga. Minta situs tersebut untuk menggunakan Alat penghapusan di akun Search Console, atau gunakan alat Konten Usang untuk meminta sistem Google memperbarui hasil penelusuran.
Tunggu hingga permintaan penghapusan URL tidak berlaku lagi (ini terjadi setelah URL diperbarui di indeks Google Penelusuran, atau setelah sekitar 6 bulan).