Best practice per la struttura degli URL per Google
Google supporta gli URL definiti dallo standard RFC 3986. I caratteri definiti dallo standard come prenotati devono essere codificati in percentuale. I caratteri ASCII non prenotati possono essere lasciati nel formato non codificato. Inoltre, i caratteri nell'intervallo non ASCII devono avere una codifica UTF-8.
Se possibile, utilizza negli URL parole di senso compiuto anziché lunghi ID numerici.
Consigliato. Parole semplici e descrittive nell'URL:
https://en.wikipedia.org/wiki/Aviation
Consigliato. Parole localizzate nell'URL, se applicabile.
https://www.example.com/lebensmittel/pfefferminz
Consigliato. Utilizzo della codifica UTF-8 in base alle necessità. Ad esempio, qui viene utilizzata la codifica UTF-8 per i caratteri arabi nell'URL:
https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
Nell'esempio di seguito viene utilizzata la codifica UTF-8 per i caratteri cinesi nell'URL:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
L'esempio seguente usa la codifica UTF-8 per l'umlaut nell'URL:
https://www.example.com/gem%C3%BCse
L'esempio seguente utilizza la codifica UTF-8 per le emoji nell'URL:
https://example.com/%F0%9F%A6%99%E2%9C%A8
Sconsigliato: utilizzo di caratteri non ASCII nell'URL:
https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨
Sconsigliato. Numeri ID lunghi e illeggibili nell'URL:
https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
Non utilizzare i frammenti per modificare i contenuti di una pagina, dato che generalmente Google non supporta gli URL con frammenti. Se stai utilizzando JavaScript per modificare i contenuti, utilizza invece l'API History.
Sconsigliato. Frammenti di URL:
https://example.com/#/potatoes
Se il tuo sito è multiregionale, potresti utilizzare una struttura di URL che semplifichi il targeting geografico del sito. Per ulteriori esempi su come strutturare gli URL, consulta Usare URL specifici delle aree geografiche.
Consigliato. Dominio specifico del paese:
https://example.de
Consigliato. Sottodirectory specifica del paese con gTLD:
https://example.com/de/
Valuta l'utilizzo di trattini per separare le parole negli URL, in quanto consente agli utenti e ai motori di ricerca di identificare più facilmente i concetti contenuti nell'URL. Ti consigliamo di utilizzare i trattini -
invece dei trattini bassi _
negli URL.
Consigliato. Utilizzo di trattini (-
):
https://www.example.com/summer-clothing/filter?color-profile=dark-grey
Sconsigliato. Utilizzo di trattini bassi (_
):
https://www.example.com/summer_clothing/filter?color_profile=dark_grey
Sconsigliato. Utilizzo di parole unite negli URL:
https://www.example.com/greendress
Problemi comuni correlati agli URL
Gli URL estremamente complessi, in particolare quelli contenenti più parametri, possono causare problemi ai crawler creando numeri eccessivamente elevati di URL che puntano a contenuti identici o simili sul tuo sito. Di conseguenza, Googlebot potrebbe utilizzare molta più larghezza di banda del necessario o non essere in grado di indicizzare completamente tutti i contenuti del sito.
Un numero molto elevato e ingiustificato di URL può avere molteplici cause, ad esempio:
- Filtri aggiuntivi di un gruppo di elementi. Molti siti forniscono visualizzazioni diverse dello stesso gruppo di elementi o risultati di ricerca. Spesso, infatti, consentono all'utente di filtrare il gruppo in base a criteri definiti (ad esempio, "mostrami hotel vicino alla spiaggia"). Quando i filtri possono essere combinati per addizione (ad esempio, "hotel vicino alla spiaggia e con centro fitness"), il numero di URL (visualizzazioni di dati) nei siti aumenta a dismisura. La creazione di un numero elevato di elenchi di hotel con lievi differenze è ridondante, in quanto Googlebot ha bisogno di vedere solo pochi elenchi per raggiungere la pagina di ciascun hotel. Ad esempio:
- Proprietà alberghiere a "tariffe vantaggiose":
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
- Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
- Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia e con un centro fitness:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
- Proprietà alberghiere a "tariffe vantaggiose":
- Generazione dinamica dei documenti. Questa operazione può comportare leggere modifiche, a causa di contatori, timestamp o presenza di pubblicità.
- Parametri problematici nell'URL. Gli ID sessione, ad esempio, possono creare enormi quantità di duplicati e un numero molto elevato di URL.
-
Parametri di ordinamento. Alcuni siti di shopping di grandi dimensioni forniscono più modalità di ordinamento degli stessi articoli e ciò comporta un notevole aumento del numero di URL. Ad esempio:
https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- Parametri irrilevanti nell'URL, ad esempio parametri di referral. Ad esempio:
https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- Problemi del calendario. Un calendario generato dinamicamente può creare link a date passate e future senza restrizioni sulle date di inizio e di fine. Ad esempio:
https://www.example.com/calendar.php?d=13&m=8&y=2011
- Link relativi inaccessibili. I link relativi inaccessibili sono spesso causa di spazi infiniti. Questo problema si verifica soprattutto quando ci sono elementi del percorso ripetuti. Ad esempio:
https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
Risolvere i problemi correlati agli URL
Per evitare potenziali problemi relativi alla struttura degli URL, consigliamo di procedere come riportato di seguito:
- Crea una struttura di URL semplice. Organizza i contenuti in modo che gli URL abbiano una struttura logica e comprensibile per le persone.
- Valuta l'utilizzo di un file robots.txt per bloccare l'accesso di Googlebot a URL che presentano problemi. In genere, valuta la possibilità di bloccare gli URL dinamici, come quelli che generano i risultati di ricerca, o gli URL che possono creare spazi infiniti, come i calendari. L'utilizzo di espressioni regolari nel file robots.txt ti consente di bloccare facilmente un numero elevato di URL.
- Dove possibile cerca di non utilizzare ID sessione negli URL. Sostituiscili con i cookie.
- Se il testo in maiuscolo e minuscolo di un URL viene trattato nello stesso modo dal server web, converti tutto il testo in modo che abbia la stessa combinazione di maiuscole e minuscole. Sarà quindi più facile per Google stabilire che gli URL fanno riferimento alla stessa pagina.
- Cerca di ridurre la lunghezza degli URL, se possibile, eliminando i parametri non necessari.
-
Se il tuo sito include un calendario infinito, aggiungi un attributo
nofollow
ai link che rimandano a pagine future del calendario create dinamicamente. - Verifica l'eventuale presenza di link relativi inaccessibili nel sito.