Programmable Search Engine mit Konfigurationsdateien erstellen

Auf dieser Seite werden die grundlegenden Konzepte der Konfigurationsdateien für die Programmable Search Engine vorgestellt.

  1. Übersicht
  2. Was ist eine Programmable Search Engine?
  3. Funktionsweise der Komponenten
  4. Suchmaschine erstellen
  5. Programmable Search Engine-Dateien bearbeiten
  6. Das richtige Format auswählen

Übersicht

Wenn Ihnen das Steuerfeld nicht die Anpassungsmöglichkeiten bietet, die Sie benötigen, sollten Sie die Verwendung des XML-Formats für die programmierbare Suche in Betracht ziehen. Dieses Format bietet Ihnen mehr Kontrolle, Flexibilität und Zugriff auf leistungsfähigere Funktionen.

Damit Sie die Konfigurationsdateien für die Programmable Search Engine verwenden können, müssen Sie zuerst mithilfe des Programmable Search Engine-Steuerfelds eine einfache Suchmaschine erstellen. Sobald Sie Ihre Suchmaschine erstellt haben, können Sie Ihre Anmerkungen und Kontext-XML-Dateien auf der Seite Übersicht im Steuerfeld herunterladen.

XML-Grundlagen

Extensible Markup Language bzw. XML ist eine universelle Auszeichnungssprache. Es handelt sich um Text mit Tags, den Sie lesen können. Beispielsweise enthält das XML-Format für die Programmable Search die folgenden Tags: <Context> </Context> und <LookAndFeel> </LookAndFeel>.

Wie bei jeder XML-Datei müssen Ihre Spezifikationen für die Programmable Search Engine der XML-Syntax (<element attribute="value">content</element>) entsprechen und korrekt formatiert sein. Für XML gelten die folgenden Regeln:

  • Bei XML muss Ihren Top-Level-Tags eine XML-Deklaration (<?xml version="1.0"?>) vorangestellt werden. Für die Konfigurationsdatei der Programmable Search Engine ist dies jedoch nicht erforderlich.
  • Alle Elemente müssen ein öffnendes Tag (<tag>) und ein schließendes Tag (</tag>) haben.
  • Alle Ihre Tags müssen ordnungsgemäß verschachtelt sein. Du kannst keinen XML-Code in folgendem Format haben: <sandwich><filling> peanut butter</sandwich></filling>. Stattdessen sollte sie so aussehen: <sandwich><filling> peanut butter</filling></sandwich>.
  • Bei XML wird zwischen Groß- und Kleinschreibung unterschieden. Beachten Sie die Groß- und Kleinschreibung sowie die Schreibweise der Tags in den Anweisungen.
  • Alle Attributwerte müssen in doppelte Anführungszeichen (<element attribute="value">) gesetzt werden.
  • Alle Attribute müssen im öffnenden Tag (<element attribute="value">) und nicht im schließenden Tag ( </element>) definiert werden.

Mit Kommentar-Tags (<!-- your comment here -->) können Sie Notizen für sich selbst schreiben. Die Programmable Search Engine parst diese Textzeile dann nicht als XML-Code. Neben dem Schreiben von Erinnerungen oder Beschreibungen kannst du Kommentare verwenden, um vorübergehend einen XML-Code außer Betrieb zu nehmen, z. B. weil du mit bestimmten Effekten experimentieren oder Probleme beheben möchtest. Diese Kommentare werden jedoch nicht in den Dateien beibehalten, die Sie aus dem Steuerfeld herunterladen. Wenn Sie die Kommentare behalten möchten, sollten Sie eine Kopie Ihrer kommentierten XML-Dateien behalten, auch nachdem Sie sie in das Steuerfeld hochgeladen haben.

Sie können XML-Dateien mit einem einfachen Texteditor erstellen und bearbeiten. Speichern Sie die Textdatei einfach mit der Dateiendung .xml (z. B. cse_badminton.xml).

Nach oben

Was beinhaltet eine Programmable Search Engine?

Eine Programmable Search Engine hat zwei Hauptkomponenten, die jeweils durch eine XML-Datei gesteuert werden:

  • Kontext: In der Kontext-XML-Datei werden die grundlegenden Funktionen einer Suchmaschine beschrieben. Sie legt die globalen Einstellungen der Suchmaschine fest, z. B. ob die Bildersuche oder bevorzugte Suchergebnisse aktiviert sind. Jede Suchmaschine hat ihre eigene Kontextdatei. Weitere Informationen zur Kontext-XML-Datei Weitere Informationen zur Auswahl des am besten geeigneten Dateiformats für Ihre Suchmaschine finden Sie unter Das richtige Format für Ihre Suchmaschine auswählen.
  • Anmerkungen: In der XML-Datei für Anmerkungen sind die Webseiten oder Websites aufgelistet, die Ihre Suchmaschine abdecken soll. Außerdem können Sie dort Ihre Präferenzen bezüglich der Rangfolge dieser Websites in den Suchergebnissen angeben. Jede Website und die zugehörigen Informationen werden als Anmerkung bezeichnet. Weitere Informationen zur Annotations-XML-Datei

Wir raten davon ab, diese Dateien komplett neu zu erstellen. Laden Sie sie stattdessen von der Seite Übersicht im Steuerfeld herunter.

Zusätzlich zu diesen Hauptkomponenten kann eine Suchmaschine auch über die folgenden Hilfsdateien verfügen:

  • Bevorzugte Suchergebnisse: Die XML-Datei für bevorzugte Suchergebnisse enthält eine Reihe benutzerdefinierter Ergebnisse, die durch einen vordefinierten Satz von Suchbegriffen ausgelöst werden. Gibt ein Nutzer eine Suchanfrage ein, die genau mit einem Ihrer Suchbegriffe übereinstimmt, wird die Werbung oben auf der Seite angezeigt. Sie können Werbung verwenden, um die Anfragen Ihrer Nutzer direkt zu beantworten, sie zu wichtigen Informationen weiterzuleiten oder sie auf Webseiten zu verweisen, die nicht oben auf der Ergebnisseite, aber besonders relevant sind. Im Steuerfeld werden Angebote auf dem Tab Angebote definiert. Weitere Informationen zu Angeboten
  • Synonyme: In der XML-Datei für Synonyme werden die Suchanfragen Ihrer Nutzer um Varianten des Suchbegriffs erweitert. Wenn ein Nutzer z. B. nach „Affe“ sucht, sucht die Suchmaschine auch nach „Affe“. und „Affe“. Synonyme werden im Steuerfeld auf dem Tab Synonyme definiert. Weitere Informationen zu Synonymen

Zusammenwirken der Komponenten

Die Kontext-XML-Datei gibt nicht die zu verwendende Annotationsdatei an und die Annotations-XML verweist nicht auf die Kontextdatei. Die Programmable Search Engine verknüpft mithilfe von Labels Kontext und Annotationen. Die Kontext-XML-Datei enthält Labels, die die Suchmaschine identifizieren, und jede in der Annotations-XML-Datei ist mit einem oder mehreren Labels gekennzeichnet, die die entsprechenden Suchmaschinen identifizieren.Wenn Sie den Namen des Labels in der Kontextdatei ändern, müssen Sie alle Anmerkungen ändern, die mit diesem Label gekennzeichnet wurden.

Obwohl Sie mehrere Anmerkungsdateien hochladen können, führt die Programmable Search Engine alle Ihre Anmerkungsdateien in einer einzigen Anmerkungsdatei zusammen, wenn Sie sie über das Steuerfeld herunterladen. Mithilfe der Annotationsdateien kann dieselbe Website flexibel für verschiedene Suchmaschinen angepasst werden. Eine Suchmaschine könnte beispielsweise ihre Suche auf einige Websites beschränken, eine andere könnte diese Websites ausschließen und eine andere könnte diese Websites bewerben.

context.xml

Hier ist ein Beispiel für eine context.xml-Datei mit Labels, die die Suchmaschine identifizieren, auf die sie angewendet wird:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

Das folgende Beispiel für eine Annotationsdatei zeigt, wie jede Website (Annotation) mit einem Label verknüpft ist:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Nach oben

Erweiterte Programmable Search Engines erstellen

Das Erstellen erweiterter Engines umfasst folgende Schritte:

  1. Bestimmen Sie das Format, das Ihren Anforderungen entspricht.
  2. Legen Sie die Spezifikationen für Ihre Suchmaschine fest.
  3. Sagen Sie der Programmable Search Engine, nach welchen Websites gesucht werden soll.
  4. Weisen Sie der Programmable Search Engine das Ranking der Suchergebnisse an.

Dateien der Programmable Search Engine bearbeiten

Um an einer XML-Datei zu arbeiten, laden Sie die XML-Spezifikation von der Seite Übersicht im Steuerfeld herunter. Dateien nicht von Grund auf neu erstellen Gehen Sie so vor:

  1. Laden Sie die Kontextdatei oder die Annotationsdatei von der Seite Übersicht im Steuerfeld herunter. Klicken Sie im Bereich Suchfunktionen auf die Schaltfläche Herunterladen.
  2. Verwenden Sie einen Texteditor, der Zeilenenden im UNIX-Stil verarbeiten kann. WordPad, Emacs und TextMate funktionieren, NotePad nicht. Es spielt keine Rolle, wie Sie die Datei benennen, solange Sie sie mit der Dateiendung .xml speichern (z. B. cx_global.xml)
  3. Erstellen Sie eine Sicherungskopie der heruntergeladenen Datei für den Fall, dass die bearbeitete Version nicht wie erwartet funktioniert und Sie die vorherige Version wiederherstellen müssen.

    Wenn Sie keine Kopie erstellen und die bearbeitete Version nicht ordnungsgemäß funktioniert, müssen Sie Fehler in Ihrer Datei beheben oder Ihre Suchmaschine erneut von vorn erstellen. Kein Spaß.

  4. Bearbeiten Sie die XML-Datei und speichern Sie sie. Achten Sie darauf, dass Ihr Texteditor die Datei als Unicode-Textdokument und nicht in einem anderen Dateiformat speichert.
  5. Laden Sie die Datei auf der Seite Übersicht im Abschnitt Suchfunktionen hoch.

Das richtige Format auswählen

Bevor Sie mit der Erstellung Ihrer Programmable Search Engine beginnen, sollten Sie sich überlegen, welches Format Ihren Anforderungen am besten entspricht. Sie sollten kein Format auswählen, das leistungsfähiger und komplexer ist als das, was Sie benötigen, und auch kein Format verwenden, das schnell zu klein wird.

Wählen Sie das passende Format anhand der folgenden Tabelle aus.

Zum Erstellen Verwenden Because Beschränkungen Weitere Informationen
Eine oder wenige Suchmaschinen mit wenigen Websites Steuerfeld Sie können Ihre Programmable Search Engine schnell erstellen, indem Sie Textfelder ausfüllen, anstatt Dateien mit einem Texteditor zu erstellen und hochzuladen. Das Steuerfeld ist vor allem nützlich, um sich mit der Programmable Search Engine vertraut zu machen und Suchmaschinen mit wenigen Websites zu erstellen. Einstieg
Komplexe Suchmaschinen mit vielen Websites, Feeds verwenden Kontextdatei und Annotationsdateien

Die Programmable Search Engine-Dateien geben Ihnen mehr Kontrolle über Ihre Suchmaschinen und erleichtern die Definition und Verwaltung von Websites erheblich.

Auch wenn Sie Ihre Suchmaschine mithilfe von Kontext- und Anmerkungsdateien erstellen möchten, ist es dennoch ratsam, sich mit dem Steuerfeld vertraut zu machen.

Je mehr Sie Ihre Suchmaschine anpassen, desto komplexer wird sie. Sie müssen die Elemente und Attribute der programmierbaren Suche erlernen, die nicht schwer zu erlernen sind, aber erfordern, dass Sie etwas Zeit investieren.

Sie müssen den Rest des Entwicklerhandbuchs lesen, da dieser nicht das interessanteste Lesematerial ist.

Kontext: Suchmaschinenspezifikationen definieren und Anmerkungen: Websites auswählen

Nach oben