Creare un Motore di ricerca programmabile con i file di configurazione

Questa pagina introduce i concetti di base alla base dei file di configurazione di Motore di ricerca programmabile.

  1. Panoramica
  2. Funzionalità di un Motore di ricerca programmabile
  3. Come funzionano insieme i componenti
  4. Creazione di un motore di ricerca
  5. Modifica dei file del Motore di ricerca programmabile
  6. Scegliere il formato giusto

Panoramica

Se il Pannello di controllo non ti offre il livello di personalizzazione necessario, valuta la possibilità di utilizzare il formato XML Ricerca programmabile, che ti offre controllo, flessibilità e accesso a funzionalità più potenti.

Per utilizzare i file di configurazione di Motore di ricerca programmabile, inizia creando un motore di ricerca di base utilizzando il pannello di controllo di Motore di ricerca programmabile. Una volta creato il motore di ricerca, puoi scaricare le annotazioni e i file XML di contesto dalla pagina Panoramica del pannello di controllo.

Nozioni di base su XML

Extensible Markup Language, o XML, è un linguaggio di markup generico. È testo con tag che puoi leggere. Ad esempio, il formato XML Ricerca programmabile include i seguenti tag: <Context> </Context> e <LookAndFeel> </LookAndFeel>.

Come per qualsiasi file XML, le specifiche del Motore di ricerca programmabile devono seguire la sintassi XML (<element attribute="value">content</element>) ed essere in un formato corretto. Il file XML prevede le seguenti regole:

  • Il formato XML richiede di anteporre ai tag di primo livello una dichiarazione XML (<?xml version="1.0"?>), ma non è richiesta dal file di configurazione di Motore di ricerca programmabile.
  • Tutti gli elementi devono avere un tag di apertura (<tag>) e un tag di chiusura (</tag>).
  • Tutti i tag devono essere nidificati correttamente. Non puoi avere un codice XML simile a: <sandwich><filling> peanut butter</sandwich></filling>. Dovrebbe essere invece simile al seguente: <sandwich><filling> peanut butter</filling></sandwich>.
  • Il formato XML è sensibile alle maiuscole, quindi segui attentamente l'ortografia e le lettere maiuscole dei tag incluse nelle istruzioni.
  • Tutti i valori degli attributi devono essere racchiusi tra virgolette doppie (<element attribute="value">).
  • Tutti gli attributi devono essere definiti nel tag di apertura (<element attribute="value">), non nel tag di chiusura ( </element>).

Puoi scrivere note per te stesso utilizzando i tag di commento (<!-- your comment here -->) e il Motore di ricerca programmabile non analizzerà quella riga di testo come codice XML. Oltre a scrivere promemoria o descrizioni, puoi utilizzare i commenti per mettere temporaneamente fuori servizio un codice XML (ad esempio perché vuoi sperimentare determinati effetti o risolvere i problemi). Tuttavia, questi commenti non vengono conservati nei file scaricati dal Pannello di controllo. Se vuoi conservare i commenti, devi conservare una copia dei tuoi file XML commentati anche dopo averli caricati nel pannello di controllo.

Puoi utilizzare un semplice editor di testo per creare e modificare i file XML. È sufficiente salvare il file di testo con l'estensione .xml (ad esempio, cse_badminton.xml).

Torna all'inizio

Cosa offre un Motore di ricerca programmabile

Un Motore di ricerca programmabile ha due componenti principali, ognuno dei quali è controllato da un file XML:

  • Contesto: il file XML di contesto descrive le funzionalità di base di un motore di ricerca. Consente di specificare le impostazioni globali del motore di ricerca, ad esempio l'attivazione della ricerca immagini o delle promozioni. Ogni motore di ricerca ha il proprio file di contesto. Scopri di più sul file XML di contesto. Per ulteriori informazioni sulla selezione del formato file più appropriato per il tuo motore di ricerca, consulta Scelta del formato corretto per il motore di ricerca.
  • Annotazioni: il file XML delle annotazioni elenca le pagine web o i siti web che vuoi che siano coperti dal tuo motore di ricerca e indica le tue eventuali preferenze relative al ranking di questi siti nei tuoi risultati di ricerca. Ogni sito e le relative informazioni sono denominati annotazione. Scopri di più sul file XML delle annotazioni.

Non è consigliabile creare nessuno di questi file da zero. Puoi scaricarli dalla pagina Panoramica del pannello di controllo.

Oltre a questi componenti principali, un motore di ricerca può avere anche i seguenti file ausiliari:

  • Promozioni: il file XML delle promozioni elenca una serie di risultati personalizzati che vengono attivati da un insieme predefinito di termini di query. Quando un utente digita una ricerca che corrisponde esattamente a uno dei tuoi termini di ricerca, la promozione viene visualizzata nella parte superiore della pagina. Puoi utilizzare le promozioni per rispondere direttamente alle query dei tuoi utenti, indirizzarli verso informazioni importanti o indirizzarli a pagine web che non si trovano nella parte superiore della pagina dei risultati ma sono particolarmente pertinenti. Nel pannello di controllo, le promozioni sono definite nella scheda Promozioni. Scopri di più sulle promozioni.
  • Sinonimi: il file XML dei sinonimi espande le query degli utenti per includere le varianti del termine di ricerca. Ad esempio, se l'utente cerca "simian", il motore di ricerca cerca anche "scimmia" e "ape". Nel pannello di controllo, i sinonimi sono definiti nella scheda Sinonimi. Scopri di più sui sinonimi.

Funzionamento dell'interazione tra i componenti

Il file XML delle annotazioni non specifica il file delle annotazioni da utilizzare e il file XML delle annotazioni non fa riferimento al file di contesto. Il Motore di ricerca programmabile utilizza le etichette per associare contesto e annotazioni. Il file XML di contesto include etichette che identificano il motore di ricerca e ogni annotazione elencata nel file XML delle annotazioni è taggata con una o più etichette che identificano i motori di ricerca a cui appartiene.Se cambi il nome dell'etichetta nel file di contesto, devi modificare tutte le annotazioni codificate con quell'etichetta.

Anche se puoi caricare più file di annotazioni, quando li scarichi tramite il Pannello di controllo, Motore di ricerca programmabile unisce tutti i tuoi file di annotazioni in un unico file di annotazioni. I file di annotazioni offrono la flessibilità necessaria per personalizzare lo stesso sito per diversi motori di ricerca. Ad esempio, un motore di ricerca potrebbe limitare la ricerca ad alcuni siti, un altro potrebbe eliminare quei siti e un altro ancora potrebbe promuoverli.

context.xml

Ecco un esempio di file context.xml contenente etichette che identificano il motore di ricerca a cui si applica:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

Ecco un esempio di file di annotazioni che mostra in che modo ogni sito (annotazione) è associato a un'etichetta:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Torna all'inizio

Creazione di motori di ricerca programmabili avanzati

La creazione di motori avanzati prevede i seguenti passaggi:

  1. Determina il formato appropriato per le tue esigenze.
  2. Definisci le specifiche per il motore di ricerca.
  3. Indica a Motore di ricerca programmabile i siti in cui cercare.
  4. Indica a Motore di ricerca programmabile come classificare i risultati di ricerca.

Modifica dei file del Motore di ricerca programmabile

Per lavorare su un file XML, scarica la specifica XML dalla pagina Panoramica del pannello di controllo. Non creare un file da zero. Segui questi passaggi:

  1. Scarica il file di contesto o il file delle annotazioni dalla pagina Panoramica del pannello di controllo. Fai clic sul pulsante Scarica nella sezione Funzionalità di ricerca.
  2. Utilizza un editor di testo in grado di gestire le terminazioni di riga in stile UNIX (funziona WordPad, Emacs e TextMate; NotePad no). Il nome del file non è importante, purché lo salvi con l'estensione del file .xml (ad esempio, cx_global.xml)
  3. Crea una copia di backup del file scaricato nel caso in cui la versione modificata non funzioni come previsto e tu debba ripristinare la versione precedente.

    Se non crei una copia e la versione che hai modificato non funziona correttamente, dovrai eseguire il debug del file o ricreare di nuovo il motore di ricerca. Non è divertente.

  4. Modifica il file XML e salvalo. Assicurati che l'editor di testo stia salvando il file come documento di testo Unicode e non in un altro formato file.
  5. Carica il file nella sezione Funzioni di ricerca della pagina Panoramica.

Scelta del formato giusto

Prima di iniziare a creare il tuo Motore di ricerca programmabile, determina il formato più adatto alle tue esigenze. Non scegliere un formato più potente e complesso di quello che ti serve, né utilizzarne uno che rapidamente andrà oltre.

Utilizza la seguente tabella per scegliere il formato appropriato.

Per creare Usa Poiché Limitazioni Ulteriori informazioni
Uno o pochi motori di ricerca con un numero ridotto di siti Pannello di controllo Puoi creare rapidamente il tuo Motore di ricerca programmabile compilando le caselle di testo invece di creare file con un editor di testo e caricarli. Il Pannello di controllo è utile soprattutto per familiarizzare con Motore di ricerca programmabile e per creare motori di ricerca con pochi siti. Per iniziare
I motori di ricerca complessi che usano molti siti utilizzano i feed File di contesto e file di annotazioni

I file del Motore di ricerca programmabile offrono un maggiore livello di controllo sui motori di ricerca e semplificano molto le attività di definizione e gestione dei siti.

Anche se prevedi di creare il tuo motore di ricerca utilizzando file di contesto e annotazioni, è comunque una buona idea acquisire familiarità con il Pannello di controllo.

Più personalizzi il motore di ricerca, più diventa complesso. Devi conoscere gli elementi e gli attributi di ricerca programmabile, che non sono difficili da riconoscere, ma richiedono un investimento di tempo.

Dovrai leggere il resto della guida per gli sviluppatori, che purtroppo non è il materiale di lettura più interessante.

Contesto: Definizione di un motore di ricerca Specifiche e Annotazioni: selezione di siti

Torna all'inizio