Feedfetcher
Feedfetcher è la modalità con cui Google esegue la scansione di feed RSS o Atom per Google News e PubSubHubbub. Feedfetcher archivia e aggiorna periodicamente i feed richiesti dagli utenti di un'app o di un servizio. Solo i feed dei podcast vengono indicizzati nella Ricerca Google; tuttavia, se un feed non segue la specifica Atom o RSS, potrebbe essere comunque indicizzato. Ecco le risposte alle domande più frequenti sul funzionamento di questo "grabber" di feed controllato dagli utenti.
Come faccio a richiedere che Google non recuperi alcuni o tutti i feed del mio sito?
Quando gli utenti aggiungono un servizio o un'app che utilizzano dati di Feedfetcher, Feedfetcher di Google cerca di ottenere i contenuti del feed per visualizzarli. Poiché le richieste di Feedfetcher derivano da azioni esplicite degli utenti e non da crawler automatizzati, Feedfetcher ignora le regole del file robots.txt.
Se il feed è pubblicamente disponibile, Google non può impedire agli utenti di accedervi. Una soluzione è configurare il tuo sito in modo che visualizzi un messaggio di errore 404
, 410
o altro messaggio di stato di errore allo user agent Feedfetcher-Google
.
Se il feed è fornito da un servizio di hosting di blog o siti, collabora direttamente con questo servizio per limitare l'accesso al tuo feed.
Con quale frequenza Feedfetcher recupererà i miei feed?
In media, Feedfetcher non dovrebbe recuperare i feed dalla maggior parte dei siti più di una volta all'ora. Alcuni siti aggiornati di frequente potrebbero essere controllati più spesso. Tieni però presente che, a causa di ritardi di rete, è possibile che Feedfetcher all'apparenza recuperi i tuoi feed con maggiore frequenza, ma soltanto temporaneamente.
Perché Feedfetcher tenta di scaricare link errati dal mio server o da un dominio che non esiste?
Feedfetcher recupera i feed su richiesta delle app o dei servizi installati dagli utenti. È possibile che un utente richieda il recupero dell'URL di un feed che non esiste.
Perché Feedfetcher scarica informazioni dal mio server web "segreto"?
Feedfetcher recupera i feed su richiesta delle app o dei servizi installati dagli utenti. È possibile che la richiesta provenga da un utente che è a conoscenza del tuo server "segreto" o che lo ha digitato per sbaglio.
Perché Feedfetcher non rispetta le istruzioni del mio file robots.txt?
Feedfetcher recupera i feed soltanto dopo che gli utenti hanno avviato esplicitamente un servizio o un'app che richiedono dati dal feed. Feedfetcher si comporta come un agente diretto dell'utente umano, non come un robot, pertanto ignora i contenuti del file robots.txt. Poiché Feedfetcher agisce come agente per più utenti, risparmia larghezza di banda inviando le richieste per i feed comuni solo una volta per tutti gli utenti che hanno richiesto il feed tramite un'app o un servizio. I feed comuni sono RSS e Atom.
Puoi impedire a Feedfetcher di eseguire la scansione del tuo sito configurando il tuo server in modo da visualizzare per lo user agent
Feedfetcher-Google
un messaggio di stato relativo a errori 404
, 410
o ad altri errori.
Perché ci sono visite da più computer su Google.com, tutti con user agent Feedfetcher?
Feedfetcher è stato progettato per essere distribuito su più computer per migliorare le prestazioni e segue il ritmo di crescita del web. Per ridurre l'impiego di larghezza di banda, i computer utilizzati sono spesso situati in prossimità dei siti da cui recuperano informazioni sulla rete.
Potete indicarmi gli indirizzi IP da cui Feedfetcher invia le richieste, in modo da poter filtrare i miei log?
Gli indirizzi IP utilizzati da Feedfetcher sono inclusi nell'oggetto user-triggered-fetchers-google.json.
Perché Feedfetcher scarica più volte la stessa pagina del mio sito?
In genere, Feedfetcher scarica solo una copia di ogni file dal tuo sito nel corso di una sessione di recupero di feed. In rare occasioni, i computer vengono fermati e riavviati, il che può comportare un nuovo recupero di pagine visitate di recente.
Quali tipi di link vengono seguiti da Feedfetcher?
Diversamente dai normali web crawler, Feedfetcher non segue i link, ma segue le richieste inviate dagli utenti di un servizio o un'app che utilizzano Feedfetcher.
La risposta alla mia domanda su Feedfetcher non è presente in questo elenco. Dove posso chiedere ulteriore assistenza?
Se continui ad avere problemi, prova a pubblicare la tua domanda nel forum di Google Search Central.