Miti e fatti sulla scansione

Verifica le tue conoscenze sulla modalità di scansione dei siti web da parte di Google.

La compressione delle Sitemap può aumentare il budget di scansione a mia disposizione.
Vero
Falso
No, è falso. Anche se inserite in file .zip, le Sitemap devono comunque essere recuperate sul server, pertanto Google non risparmia molto in termini di tempo o di impegno quando invii Sitemap compresse.
Google preferisce che i contenuti siano i più aggiornati possibili, quindi mi conviene continuare ad apportare piccole modifiche alla mia pagina.
Vero
Falso
Per la Ricerca Google, i contenuti vengono classificati in base alla qualità e non a quando risalgono. Crea e aggiorna i tuoi contenuti secondo necessità. Vale a ben poco far sì che, con un artificio, le pagine appaiano rinnovate apportandovi banali modifiche e aggiornandone la data.
Google preferisce contenuti vecchi (hanno più peso) rispetto a contenuti nuovi.
Vero
Falso
Se la tua pagina è utile, resta tale, indipendentemente dall'età dei contenuti.
Google preferisce URL puliti privi di parametri di ricerca.
Vero
Falso
Possiamo eseguire la scansione dei parametri.
Quanto più è elevata la velocità di caricamento e rendering di pagina, tanto maggiore sarà la capacità di scansione di Google.
Vero
Vero, nel senso che le nostre risorse sono limitate da una combinazione di tempo e numero di bot di scansione disponibili. Se riesci a pubblicare più pagine in tempi brevi, potremo eseguire la scansione di un maggior numero di queste. Potremmo tuttavia dedicare più tempo alla scansione di un sito che contiene informazioni più importanti, anche se è più lento. È probabilmente più importante per te rendere il tuo sito più veloce per gli utenti che per aumentare la copertura di scansione. È molto più semplice aiutare Google a eseguire la scansione dei contenuti giusti piuttosto che di tutti i contenuti ogni volta. Tieni presente che la scansione di un sito è costituita tanto dal recupero quanto dal rendering dei contenuti. Il tempo dedicato al rendering della pagina viene conteggiato al pari del tempo trascorso per richiederla. Pertanto, quanto più veloce è il rendering delle pagine tanto più veloce sarà la scansione.
Falso
I siti di piccole dimensioni non vengono sottoposti a scansione con la stessa frequenza dei siti di grandi dimensioni.
Vero
Falso
Se un sito presenta contenuti importanti che subiscono frequenti modifiche, spesso ne eseguiamo la scansione, indipendentemente dalle dimensioni.
Quanto più vicini sono i contenuti alla home page, tanto più importanti sono considerati da Google.
Vero
Parzialmente vero
La home page è spesso la pagina più importante del tuo sito, pertanto le pagine collegate in modo diretto alla home page potrebbero essere considerate più importanti e quindi sottoposte più frequentemente a scansione. Tuttavia, ciò non significa che queste pagine avranno un ranking più elevato rispetto alle altre pagine del tuo sito.
Falso
Utilizzare URL con versioni è un metodo efficace per incoraggiare Google a ripetere la scansione delle mie pagine.
Vero
Parzialmente vero
L'utilizzo di URL con versione per la tua pagina con l'intento di indurre Google a eseguirne di nuovo la scansione potrebbe funzionare, ma spesso non è necessario e comporta uno spreco di risorse di scansione se la pagina non ha subito alcuna effettiva modifica. Se decidi comunque di utilizzare URL con versione per indicare nuovi contenuti, ti consigliamo di modificare l'URL solo se i contenuti della pagina hanno subito sostanziali modifiche.
Falso
La velocità del sito e gli errori incidono sul mio budget di scansione.
Vero
Rendere un sito più veloce migliora l'esperienza degli utenti e aumenta anche la frequenza di scansione. Per i crawler di Google un sito veloce è sintomatico di server integri e che, pertanto, può recuperare più contenuti con lo stesso numero di connessioni, mentre un numero significativo di codici di stato della risposta HTTP 5xx (errori del server) o timeout della connessione indica il contrario e la scansione rallenta. Consigliamo di prestare attenzione al report Statistiche di scansione in Search Console e di ridurre il numero di errori del server.
Falso
La scansione è un fattore di ranking nella Ricerca Google.
Vero
Falso
Migliorare la frequenza di scansione non comporta necessariamente il miglioramento della posizione nei risultati della Ricerca Google. Google si avvale di numerosi indicatori per classificare i risultati e, sebbene la scansione sia necessaria affinché una pagina sia visualizzata nei risultati di ricerca, non è un indicatore del suo ranking.
URL alternativi e contenuti incorporati contano ai fini del budget di scansione.
Vero
In genere, qualsiasi URL di cui Googlebot esegue la scansione viene conteggiato ai fini del budget di scansione di un sito. Gli URL alternativi, come AMP o hreflang, nonché i contenuti incorporati, come CSS e JavaScript, inclusi i recuperi XHR, potrebbero dover essere sottoposti a scansione e consumare il budget di scansione di un sito.
Falso
Posso controllare i crawler di Google con la regola "crawl-delay".
Vero
Falso
La regola non standard "crawl-delay" del file robots.txt non viene elaborata dai crawler di Google.
La regola nofollow incide sul budget di scansione.
Vero
Parzialmente vero
Qualsiasi URL sottoposto a scansione incide sul budget di scansione e quindi, anche se una pagina contrassegna un URL come nofollow, questo URL può comunque essere sottoposto a scansione se un'altra pagina del tuo sito o qualsiasi pagina del web non etichetta il link come nofollow.
Falso
Posso utilizzare noindex per controllare il budget di scansione.
Vero
Parzialmente vero
Qualsiasi URL sottoposto a scansione incide sul budget di scansione, e Google deve eseguire la scansione della pagina per trovare la regola noindex.

Tuttavia, noindex serve ad aiutarti a non indicizzare nulla. Se vuoi assicurarti che queste pagine non vengano inseriti nell'indice di Google, continua a utilizzare noindex e non preoccuparti del budget di scansione. Inoltre, è importante far presente che se rimuovi gli URL dall'indice di Google con noindex o in altro modo, i crawler di Google possono concentrarsi su altri URL nel tuo sito, il che significa che noindex nel lungo periodo può liberare indirettamente del budget di scansione per il sito.
Falso
Le pagine che mostrano codici di stato HTTP 4xx sprecano budget di scansione.
Vero
Falso
Le pagine che mostrano codici di stato HTTP 4xx (tranne 429) non sprecano budget di scansione. Google ha tentato di eseguire la scansione della pagina, ma ha ricevuto un codice di stato e nessun altro contenuto.