Anotasi: Menentukan Situs yang akan Ditelusuri

Halaman ini menjelaskan cara menetapkan cakupan mesin telusur Anda menggunakan file penjelasan XML.

  1. Overview
  2. Menggunakan Format XML Programmable Search
  3. Meningkatkan Cakupan Penelusuran
  4. Batas Anotasi

Ringkasan

Mengelola banyak kumpulan situs dapat melelahkan jika Anda membangun mesin telusur yang besar. Alih-alih, Anda dapat menambahkan dan mengelola banyak situs dengan mencantumkannya dalam file anotasi dan mengunggahnya. Selain itu, file anotasi memberikan kontrol yang jauh lebih besar terhadap peringkat hasil penelusuran.

File anotasi merupakan daftar anotasi. Setiap anotasi memiliki dua komponen: situs dan label yang terkait. Label tersebut memberi tahu Programmable Search Engine cara menangani situs; yakni, apakah situs harus disertakan, dikecualikan, dipromosikan, atau didemosikan. Dalam file konteks, Anda menentukan label; dalam file anotasi, Anda memberi tag pada situs dengan label yang sesuai.

Ketika Anda mulai mengedit file anotasi, mulailah dengan membuat anotasi dalam jumlah kecil. Pengujian dan pemecahan masalah mesin telusur menjadi lebih mudah dengan beberapa anotasi. Saat Anda mendapatkan hasil yang diharapkan, tambahkan lebih banyak anotasi secara bertahap.

Anda dapat mengupload file anotasi ke Control Panel. Untuk detail tentang batas file, lihat bagian Batas Anotasi.

Kembali ke atas

Menggunakan Format XML Programmable Search

Jika Anda ingin memanfaatkan semua fitur yang tersedia di file konfigurasi Programmable Search Engine, XML adalah cara yang tepat.

Anotasi XML

Berikut adalah contoh anotasi XML. File anotasi ini memberi tahu Programmable Search Engine untuk menyertakan semua yang ada di www.webmd.com/hw/* tetapi mengecualikan semua yang ada di www.webmd.com/hw/cancer/*.

<Annotations>
  <Annotation about="www.cancer.gov/cancertopics/types/liver/*">
    <Label name="_include_"/>
    <Comment>government site</Comment>
  </Annotation>
  <Annotation about="www.medicinenet.com/liver_cancer/">
    <Label name="_exclude_"/>
    <Comment>site on symptoms</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/*">
    <Label name="_include_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/cancer/*">
    <Label name="_exclude_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.oncologychannel.com/*/treatment">
    <Label name="_exclude_"/>
  </Annotation>
</Annotations>

File anotasi memiliki empat elemen dalam hierarki berikut:

  • Annotations (elemen root)
    • Annotation
      • Label
      • Comment (opsional)

Kembali ke atas

Membuat Anotasi Eksternal

Untuk mencantumkan situs yang ingin disertakan dalam mesin telusur, lakukan hal berikut:

  1. Mulai file dengan elemen root <Annotations></Annotations>.
  2. Buat anotasi dengan menambahkan tag <Annotation></Annotation>, lalu tentukan atribut about dengan pola URL situs.
    <Annotations>
       <Annotation about="www.webmd.com/hw/cancer/*">
       </Annotation>
       </Annotations>
    
  3. Kaitkan situs dengan mesin telusur menggunakan tag <Label name=" "/>, dan tentukan bagaimana situs tersebut harus diperlakukan oleh mesin telusur. Anda dapat memperoleh label untuk mesin telusur dari file Konteks mesin telusur. Anda akan menemukan dua label: satu untuk menambahkan situs ke Programmable Search Engine dan satu lagi untuk mengecualikan situs. Jika Anda belum mengubah nama label mesin telusur di file konteks, label untuk menyertakan situs ditampilkan dalam bentuk _include_, dan label untuk mengecualikan situs berbentuk _exclude_. Untuk menghindari error, salin dan tempel label ini daripada mengetiknya secara manual.
       <Annotations>
       <Annotation about="http://www.solarenergy.org/*">
         <Label name="_include_"/>
       </Annotation>
    </Annotations>
    

    Satu situs dapat memiliki beberapa label yang terkait dengannya,

    Jika Anda telah mengubah nama label dalam file konteks, jangan lupa untuk memperbarui nilai Label name di file anotasi Anda.

  4. Untuk menambahkan situs lainnya, buat dan tentukan elemen Annotation lain.
  5. Simpan file XML.

Kembali ke atas

Meningkatkan Cakupan Penelusuran

Programmable Search Engine dibuat di atas indeks Google. Hal ini berarti bahwa halaman web yang ada dalam indeks Google tersedia untuk mesin telusur Anda; Sebaliknya, halaman web yang belum di-crawl oleh Google tidak akan muncul dalam hasil penelusuran Anda. Jika ingin Programmable Search Engine Anda menyertakan situs yang saat ini tidak ada di indeks Google, kirimkan Peta Situs ke Google Search Console.

Peta situs berisi daftar halaman di situs Anda, serta informasi tentang frekuensi pembaruan halaman web dan kepentingannya relatif terhadap satu sama lain. Mengirimkan Peta Situs akan membantu Google menemukan halaman web Anda dan meningkatkan jadwal crawling. Untuk mempelajari lebih lanjut tentang Peta Situs, lihat Pusat Bantuan Webmaster dan Menggunakan Protokol Peta Situs. Jika Anda tertarik untuk membuat Peta Situs yang lebih mewah, lihat http://www.sitemaps.org/protocol.php.

Mengirimkan Peta Situs sangat membantu jika situs Anda memiliki hal-hal berikut:

  • Konten dinamis
  • Halaman yang tidak mudah ditemukan oleh Googlebot (crawler web Google), seperti halaman yang memiliki fitur AJAX atau Flash yang kaya
  • Hanya sedikit situs web yang menautkannya.

    Googlebot meng-crawl web dengan mengikuti link dari satu halaman ke halaman lainnya, sehingga jika situs Anda tidak ditautkan dengan baik, akan sulit bagi crawler untuk menemukannya. Jika situs Anda baru, mungkin tidak banyak situs yang mengarah ke situs Anda.

  • Arsip besar halaman konten yang tidak memiliki jaringan cross-link yang kuat

Google hanya dapat mengindeks halaman yang dapat diakses. Jadi, jika Anda menggunakan file robots.txt atau tag meta robot di halaman web, pastikan halaman tersebut tidak memblokir crawler.

Peningkatan cakupan tidak langsung terjadi, karena perlu waktu beberapa saat agar halaman di-crawl dan diindeks. Namun, setelah halaman web Anda berada dalam indeks, halaman web tersebut dapat muncul di penelusuran Google dan Programmable Search Engine Anda.

Kembali ke atas

Batas Anotasi

Tabel berikut mencantumkan batas file anotasi yang diupload ke Programmable Search Engine:

Catatan: Ikuti batasan dengan cermat; jika Anda melampaui batas tersebut, mesin telusur mungkin tidak menampilkan hasil.

Aspek Batas
Ukuran file (file konteks atau anotasi) 30KB
Jumlah maksimum anotasi per mesin telusur 5.000

Tips: Jika Anda mendapati mesin telusur Anda melampaui batas 5.000 situs yang besar, pertimbangkan untuk menggabungkan URL individual ke dalam pola URL.

Kembali ke atas