Adnotacje: Definiowanie witryn do przeszukiwania

Na tej stronie opisano sposób definiowania zasięgu wyszukiwarki za pomocą pliku adnotacji XML.

  1. Omówienie
  2. Korzystanie z formatu XML Wyszukiwarki niestandardowej
  3. Zwiększanie zasięgu wyszukiwania
  4. Limity adnotacji

Opis

Zarządzanie dużym zbiorem witryn może być uciążliwe, gdy tworzysz dużą wyszukiwarkę. Zamiast tego możesz dodać wiele witryn i zarządzać nimi, umieszczając je w pliku adnotacji i przesyłając. Poza tym pliki adnotacji dają znacznie większą kontrolę nad rankingiem wyników wyszukiwania.

Plik adnotacji to po prostu lista adnotacji. Każda adnotacja składa się z dwóch elementów: witryny i powiązanych z nią etykiet. Ta etykieta informuje Wyszukiwarki niestandardowej, jak ma obsługiwać witrynę, czyli czy witryna powinna zostać uwzględniona, wykluczona, awansowana lub zmniejszona w dół. W pliku kontekstu definiujesz etykiety, a w pliku adnotacji oznaczasz witryny odpowiednimi etykietami.

Gdy zaczniesz edytować plik z adnotacjami, zacznij od małej liczby adnotacji. Kilka adnotacji pozwala łatwiej przetestować wyszukiwarkę i rozwiązać problemy z nią. Gdy uzyskasz oczekiwane wyniki, stopniowo dodawaj więcej adnotacji.

Możesz przesłać plik adnotacji do panelu sterowania. Szczegółowe informacje o limitach plików znajdziesz w sekcji Limity adnotacji.

Powrót do góry

Korzystanie z formatu XML Wyszukiwarki niestandardowej

Jeśli chcesz korzystać ze wszystkich funkcji dostępnych w pliku konfiguracji Wyszukiwarki niestandardowej, użyj formatu XML.

Adnotacje XML

Poniżej znajdziesz przykład adnotacji XML. Ten plik z adnotacjami informuje Wyszukiwarki niestandardowej, że uwzględni wszystkie treści znajdujące się pod adresem www.webmd.com/hw/*, ale wykluczy wszystkie treści znajdujące się pod adresem www.webmd.com/hw/cancer/*.

<Annotations>
  <Annotation about="www.cancer.gov/cancertopics/types/liver/*">
    <Label name="_include_"/>
    <Comment>government site</Comment>
  </Annotation>
  <Annotation about="www.medicinenet.com/liver_cancer/">
    <Label name="_exclude_"/>
    <Comment>site on symptoms</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/*">
    <Label name="_include_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/cancer/*">
    <Label name="_exclude_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.oncologychannel.com/*/treatment">
    <Label name="_exclude_"/>
  </Annotation>
</Annotations>

Plik adnotacji ma 4 elementy w tej hierarchii:

  • Annotations (element główny)
    • Annotation
      • Label
      • Comment (opcjonalnie)

Powrót do góry

Tworzenie adnotacji zewnętrznych

Aby wyświetlić listę witryn, które ma uwzględniać wyszukiwarka, wykonaj te czynności:

  1. Rozpocznij plik od elementu głównego <Annotations></Annotations>.
  2. Utwórz adnotację, dodając tagi <Annotation></Annotation>, a potem zdefiniuj atrybut about za pomocą wzorca adresu URL witryny.
    <Annotations>
       <Annotation about="www.webmd.com/hw/cancer/*">
       </Annotation>
       </Annotations>
    
  3. Powiąż witrynę z wyszukiwarką za pomocą tagu <Label name=" "/> i określ, jak wyszukiwarka ma traktować tę witrynę. Etykiety wyszukiwarki możesz pobrać z pliku kontekstu wyszukiwarki. Zobaczysz 2 etykiety: jedną do dodawania witryn do Wyszukiwarki niestandardowej, a drugą do wykluczania witryn z niej. Jeśli nie zmienisz nazwy etykiety wyszukiwarki w pliku kontekstu, etykieta uwzględniania witryn będzie miała postać _include_, a etykieta wykluczania witryn – _exclude_. Aby uniknąć błędów, skopiuj i wklej te etykiety, zamiast wpisywać je ręcznie.
       <Annotations>
       <Annotation about="http://www.solarenergy.org/*">
         <Label name="_include_"/>
       </Annotation>
    </Annotations>
    

    Z jedną witryną może być powiązanych wiele etykiet,

    Jeśli zmienisz nazwę etykiety w pliku kontekstu, pamiętaj o zaktualizowaniu wartości Label name w pliku adnotacji.

  4. Aby dodać więcej witryn, utwórz i zdefiniuj kolejny element Annotation.
  5. Zapisz plik XML.

Powrót do góry

Zwiększanie zasięgu wyszukiwania

Wyszukiwarka niestandardowa działa w związku z indeksem Google. Oznacza to, że strony internetowe znajdujące się w indeksie Google są dostępne dla Twojej wyszukiwarki. I odwrotnie, strony, które nie zostały zindeksowane przez Google, nie będą wyświetlane w wynikach wyszukiwania. Jeśli chcesz, aby Wyszukiwarka niestandardowa uwzględniała witryny, których obecnie nie ma w indeksie Google, prześlij mapę witryny do Google Search Console.

Mapa witryny zawiera listę stron w witrynie, a także informacje o częstotliwości aktualizacji stron oraz ich wzajemnych walorach. Przesłanie mapy witryny pomoże Google znaleźć Twoje strony internetowe i usprawni harmonogram indeksowania. Więcej informacji o mapach witryn znajdziesz w Centrum pomocy dla webmasterów i artykule Korzystanie z protokołu map witryn. Jeśli chcesz tworzyć bardziej zaawansowane mapy witryn, odwiedź stronę http://www.sitemaps.org/protocol.php.

Zgłaszanie map witryn jest szczególnie przydatne, jeśli Twoja witryna zawiera:

  • Zawartość dynamiczna
  • strony internetowe, które nie są łatwo wykrywane przez Googlebota (robota indeksującego Google), np. strony z zaawansowanymi funkcjami AJAX lub Flash;
  • Mało stron internetowych z linkami do niego.

    Googlebot indeksuje sieć, śledząc linki między stronami, a jeśli Twoja witryna nie jest dobrze połączona z poszczególnymi linkami, trudno jest ją znaleźć. Jeśli Twoja witryna jest nowa, prawdopodobnie niewiele stron do niej kieruje.

  • duże archiwum stron z treścią o słabej sieci linków;

Google może indeksować tylko te strony, do których ma dostęp. Jeśli więc na swoich stronach używasz pliku robots.txt lub metatagów robots, upewnij się, że strony te nie blokują robotów.

Zwiększenie poziomu pokrycia nie jest natychmiastowe, ponieważ pobieranie i indeksowanie stron zajmuje trochę czasu. Strony internetowe umieszczone w indeksie mogą pojawiać się zarówno w wyszukiwarce Google, jak i w Wyszukiwarce niestandardowej.

Powrót do góry

Limity adnotacji

W tabeli poniżej znajdziesz ograniczenia plików adnotacji przesyłanych do Wyszukiwarki niestandardowej:

Uwaga: ściśle przestrzegaj limitów – jeśli je przekroczysz, wyszukiwarka może nie wyświetlić wyników.

Proporcje Limit
Rozmiar pliku (pliki kontekstu lub adnotacji) 30KB
Maksymalna liczba adnotacji na wyszukiwarkę 5000

Wskazówka: jeśli okaże się,że Twoja wyszukiwarka przekracza limit 5000 witryn, rozważ skonsolidowanie poszczególnych adresów URL we wzorcach adresów URL.

Powrót do góry