Budget di scansione e Googlebot

Lunedì 16 gennaio 2017

Di recente abbiamo visto molte definizioni per "budget di scansione"; tuttavia, non disponiamo di un unico termine in grado di esprimere a pieno il concetto di "budget di scansione". In questo post presentiamo la nostra definizione e cosa significa per Googlebot.

Innanzitutto, ci teniamo a sottolineare che il budget di scansione, come descritto di seguito, è un aspetto di cui la maggior parte dei publisher non devono preoccuparsi. Se le nuove pagine tendono a essere sottoposte a scansione nello stesso giorno di pubblicazione, il budget di scansione non è un aspetto primario per i webmaster; analogamente, se un sito ha meno di alcune migliaia di URL, la maggior parte delle volte verrà sottoposto a scansione in modo efficiente.

Assegnare la priorità a cosa sottoporre a scansione, quando e quante risorse il server che ospita il sito può destinare alla scansione è più importante per i siti più grandi oppure per quelli che, ad esempio, generano automaticamente pagine in base ai parametri URL.

Limite della frequenza di scansione

Googlebot è progettato per essere un buon cittadino del Web. La scansione è la sua priorità principale, così come assicurare che l'esperienza degli utenti che visitano il sito non venga compromessa. Questo meccanismo è chiamato "limite della frequenza di scansione", che limita la frequenza di recupero massima per un determinato sito.

In breve, rappresenta il numero di connessioni simultanee parallele che Googlebot potrebbe utilizzare per eseguire la scansione del sito, nonché il tempo necessario per l'attesa tra i recuperi. La frequenza di scansione