Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Menghindari pembuatan konten duplikat

Konten duplikat umumnya mengacu pada sekumpulan konten substantif di dalam atau di seluruh domain yang sama persis dengan konten lain dalam bahasa yang sama atau mirip. Kebanyakan dari konten ini sebenarnya tidak bermaksud menipu. Contoh konten duplikat yang tidak berbahaya meliputi:

  • Forum diskusi yang dapat menghasilkan halaman biasa maupun ringkasan yang ditargetkan untuk perangkat seluler
  • Item di toko online yang ditampilkan atau ditautkan oleh beberapa URL yang berbeda
  • Halaman web versi khusus printer

Jika situs Anda berisi banyak halaman dengan konten yang sebagian besar serupa, Anda dapat menunjukkan URL pilihan ke Google dengan beberapa cara. (Hal ini disebut "kanonikalisasi".) Informasi selengkapnya tentang kanonikalisasi.

Namun, pada beberapa kasus, konten memang sengaja diduplikasi di sepanjang domain sebagai usaha untuk memanipulasi peringkat mesin telusur atau meningkatkan lebih banyak traffic. Praktik penipuan seperti ini dapat menyebabkan pengalaman pengguna yang buruk saat pengunjung melihat konten yang sama berulang kali dalam rangkaian hasil penelusuran.

Google berusaha keras untuk mengindeks dan menampilkan halaman yang memiliki informasi berbeda. Pemfilteran ini artinya, sebagai contoh, jika situs Anda memiliki versi "biasa" dan "printer" untuk setiap artikel, dan tidak satu pun yang diblokir dengan tag noindex, kami akan memilih salah satu untuk dicantumkan. Dalam kasus yang jarang terjadi ketika Google menganggap bahwa konten duplikat mungkin ditampilkan dengan maksud memanipulasi peringkat dan menipu pengguna, kami juga akan membuat penyesuaian yang tepat dalam mengindeks dan menentukan peringkat situs yang terlibat. Akibatnya, peringkat situs bisa turun, atau situs bisa dihapus seluruhnya dari indeks Google, sehingga tidak akan muncul lagi di hasil penelusuran.

Ada beberapa langkah yang dapat diambil untuk menangani masalah konten duplikat secara proaktif, dan memastikan bahwa pengunjung melihat konten yang Anda inginkan untuk dilihat oleh mereka.

  • Gunakan 301: Jika Anda telah menyusun ulang situs, gunakan pengalihan 301 ("RedirectPermanent") dalam file .htaccess untuk mengalihkan pengguna, Googlebot, dan spider lain dengan cerdas. (Di Apache, Anda dapat melakukannya dengan file .htaccess; di IIS, Anda dapat melakukannya melalui konsol admin.)
  • Tetaplah konsisten: Cobalah untuk mempertahankan konsistensi link internal Anda. Misalnya, jangan menautkan ke http://www.example.com/page/, http://www.example.com/page, dan http://www.example.com/page/index.htm.
  • Gunakan domain level teratas: Untuk membantu kami menayangkan versi dokumen yang paling tepat, gunakan domain level teratas untuk menangani konten khusus negara jika memungkinkan. Kemungkinannya lebih besar bagi kami untuk mengetahui bahwa http://www.example.de berisi konten yang difokuskan untuk Jerman, misalnya, dibandingkan http://www.example.com/de atau http://de.example.com.
  • Distribusikan secara offline dengan cermat: Jika Anda melakukan distribusi konten secara offline di situs lain, Google akan selalu menampilkan versi yang dianggap paling sesuai untuk pengguna di setiap penelusuran tertentu, yang bisa jadi adalah versi pilihan Anda. Namun, akan lebih baik jika setiap situs tempat konten Anda didistribusikan secara offline mencantumkan link balik ke artikel asli Anda. Anda juga dapat meminta siapa pun yang menggunakan materi Anda yang didistribusikan secara offline untuk menggunakan tag noindex guna mencegah mesin telusur mengindeks versi konten mereka.
  • Minimalkan pengulangan boilerplate: Misalnya, daripada menyertakan teks hak cipta yang panjang di akhir setiap halaman, masukkan ringkasan yang sangat singkat, lalu tautkan ke halaman yang berisi detail yang lebih jelas.
  • Jangan memublikasikan stub penayang: Pengguna tidak suka melihat halaman "kosong", jadi hindari placeholder jika memungkinkan. Contohnya, jangan memublikasikan halaman yang belum Anda isi dengan konten sesungguhnya. Jika Anda membuat halaman placeholder, gunakan tag noindex untuk memblokir halaman tersebut dari pengindeksan.
  • Pahami sistem pengelolaan konten Anda: Pastikan Anda telah memahami cara konten ditampilkan di situs Anda. Blog, forum, dan sistem terkait sering menampilkan konten yang sama dalam berbagai format. Misalnya, sebuah entri blog dapat muncul di halaman beranda blog, halaman arsip, dan halaman entri yang lain dengan label yang sama.
  • Minimalkan konten serupa: Jika Anda memiliki banyak halaman yang serupa, pertimbangkan untuk memperluas setiap halaman atau menggabungkan halaman tersebut. Misalnya, jika Anda memiliki situs perjalanan dengan halaman terpisah untuk dua kota, tetapi informasi di kedua halaman sama, Anda dapat menggabungkan halaman tentang kedua kota tersebut, atau mengembangkan tiap halaman agar berisi konten unik tentang tiap kota.

Google tidak menyarankan pemblokiran akses crawler ke konten duplikat di situs web Anda, baik dengan file robots.txt ataupun metode lainnya. Jika mesin telusur tidak dapat meng-crawl halaman dengan konten duplikat, mesin telusur tidak dapat otomatis mendeteksi bahwa URL tersebut mengarah ke konten yang sama. Oleh karena itu, mesin telusur harus menanganinya secara efektif sebagai halaman unik yang terpisah. Solusi yang lebih baik adalah mengizinkan mesin telusur meng-crawl URL tersebut, tetapi menandainya sebagai duplikat dengan menggunakan elemen link rel="canonical" atau pengalihan 301. Jika konten duplikat membuat kami melakukan terlalu banyak crawling di situs Anda, sesuaikan setelan kecepatan crawling di Search Console.

Kami tidak akan mengambil tindakan terhadap situs atas dasar adanya konten duplikat pada situs tersebut, kecuali jika konten duplikat ditujukan untuk menipu dan memanipulasi hasil mesin telusur. Jika situs Anda mengalami masalah konten duplikat, dan Anda tidak mengikuti saran yang tercantum dalam dokumen ini, kami akan memilih versi konten yang ditampilkan di hasil penelusuran.

Namun, jika tinjauan kami menunjukkan bahwa Anda terlibat dalam praktik penipuan dan situs Anda telah dihapus dari hasil penelusuran kami, tinjau situs Anda dengan cermat. Jika situs Anda telah dihapus dari hasil penelusuran kami, tinjau Pedoman Webmaster kami untuk informasi selengkapnya. Setelah Anda membuat perubahan dan yakin bahwa situs Anda tidak lagi melanggar pedoman kami, kirimkan situs Anda untuk pertimbangan ulang.

Dalam situasi yang jarang terjadi, algoritme kami dapat memilih URL dari situs eksternal yang menghosting konten Anda tanpa izin dari Anda. Jika Anda yakin bahwa situs lain menggandakan konten Anda dengan cara yang melanggar hukum hak cipta, Anda dapat menghubungi host situs untuk meminta penghapusan. Selain itu, Anda dapat meminta Google menghapus halaman yang melakukan pelanggaran dari hasil penelusuran kami dengan mengajukan permintaan berdasarkan Digital Millennium Copyright Act.