Sprawdzone metody tworzenia struktury adresów URL dla Google
Google obsługuje adresy URL zdefiniowane w normie RFC 3986. Znaki określone przez standard jako zarezerwowane muszą być zakodowane za pomocą procentów. Niezastrzeżone znaki ASCII mogą być w formie niezakodowanej. Dodatkowo znaki spoza zakresu ASCII powinny być zakodowane w formacie UTF-8.
W miarę możliwości używaj w adresach URL czytelnych słów zamiast długich numerów identyfikacyjnych.
Zalecane – proste, opisowe słowa w adresie URL:
https://en.wikipedia.org/wiki/Aviation
Zalecane – zlokalizowane słowa w adresie URL (jeśli występują).
https://example.com/lebensmittel/pfefferminz
Zalecane – w razie potrzeby użyj kodowania UTF-8. Poniższy przykład pokazuje użycie kodowania UTF-8 w przypadku arabskich znaków w adresie URL:
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
W tym przykładzie użyto w adresie URL kodowania UTF-8 dla chińskich znaków:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
W poniższym przykładzie użyto kodowania UTF-8 dla umlautu w adresie URL:
https://example.com/gem%C3%BCse
W tym przykładzie użyto kodowania UTF-8 dla emotikonów w adresie URL:
https://example.com/%F0%9F%A6%99%E2%9C%A8
Niezalecane: użycie w adresie URL znaków innych niż ASCII:
https://example.com/نعناع
https://example.com/杂货/薄荷
https://example.com/gemüse
https://example.com/🦙✨
Niezalecane – nieczytelne, długie numery identyfikacyjne w adresie URL:
https://example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
Nie używaj fragmentów. aby zmienić zawartość strony, ponieważ Google zazwyczaj nie obsługuje adresów URL fragmentów. Jeśli zmieniasz treści przy użyciu JavaScriptu, użyj interfejsu History API. .
Niezalecane – fragmenty adresów URL:
https://example.com/#/potatoes
Jeśli Twoja witryna działa w wielu regionach, zastanów się nad strukturą adresów URL, która ułatwi kierowanie geograficzne witryny. Więcej przykładów użycia struktury adresów URL znajdziesz w artykule o używaniu adresów URL przeznaczonych dla określonych lokalizacji.
Zalecane – domena krajowa:
https://example.de
Zalecane – podkatalog dla kraju z domeną gTLD:
https://example.com/de/
Rozważ użycie łączników do rozdzielenia poszczególnych słów w adresach URL. Ułatwia to użytkownikom i wyszukiwarkom znajdowanie pojęć w adresie URL. Zalecamy stosowanie w adresach URL łączników (-
) zamiast podkreśleń (_
).
Zalecane – łączniki (-
):
https://example.com/summer-clothing/filter?color-profile=dark-grey
Niezalecane – podkreślenia (_
):
https://example.com/summer_clothing/filter?color_profile=dark_grey
Niezalecane – połączone słowa kluczowe w adresie URL:
https://example.com/greendress
Podczas określania parametrów adresu URL używaj następującego powszechnego kodowania: znaku równości (=
) do oddzielania par klucz-wartość i dodawania kolejnych parametrów za pomocą znaku ampersand (&
). Aby podać kilka wartości dla tego samego klucza w ramach pary klucz-wartość, możesz użyć dowolnego znaku, który nie koliduje z IETF STD 66, np. przecinka (,
).
Zalecane: używaj znaku równości (=
) do oddzielania par klucz-wartość i znaku ampersand (&
) do dodawania dodatkowych parametrów:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Zalecane: używaj przecinka (,
), aby podać kilka wartości dla tego samego klucza, znaku równości (=
), aby rozdzielić pary klucz-wartość, oraz ampersanda (&
), aby dodać kolejne parametry:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
Niezalecane: stosowanie dwukropka :
do oddzielania par klucz-wartość i nawiasów [ ]
do dodawania kolejnych parametrów
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
Niezalecane: używanie pojedynczego przecinka ,
do rozdzielania par klucz-wartość i podwójnego przecinka ,,
do dodawania dodatkowych parametrów
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789
Typowe problemy z adresami URL
Zbyt złożone adresy URL – a szczególnie takie, które zawierają kilka parametrów – mogą sprawiać problemy robotom ze względu na dużą liczbę adresów URL odsyłających do takich samych lub podobnych treści witryny. W związku z tym Googlebot może nadmiernie zmniejszać przepustowość lub mieć problemy z indeksowaniem całej zawartości witryny.
Zbyt duża liczba adresów URL może być wynikiem różnych sytuacji. Oto niektóre z nich:
- Addytywne filtrowanie zbioru elementów. Wiele witryn wyświetla ten sam zbiór elementów lub wyników wyszukiwania na kilka różnych sposobów, pozwalając użytkownikowi filtrować wyświetlane elementy w zależności od wybranych kryteriów (na przykład: pokaż mi hotele na plaży). Jeśli witryna dopuszcza addytywne łączenie filtrów (przykład: hotele na plaży z centrum fitness), liczba adresów URL (widoków danych) w witrynie rośnie lawinowo. Tworzenie dużej liczby nieznacznie zmodyfikowanych list hoteli jest niepotrzebne, bo Googlebotowi wystarczy niewielka liczba list, na podstawie których będzie w stanie dotrzeć do strony każdego hotelu. Na przykład:
- Zwracanie listy wszystkich tanich hoteli:
https://example.com/hotel-search-results.jsp?Ne=292&N=461
- Zwracanie listy wszystkich tanich hoteli na plaży:
https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
- Zwracanie listy wszystkich tanich hoteli na plaży z centrum fitness:
https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
- Zwracanie listy wszystkich tanich hoteli:
- Dynamiczne generowanie dokumentów. Może to prowadzić do nieznacznych zmian w zależności od liczników, sygnatur czasowych lub reklam.
- Problematyczne parametry w adresach URL. Identyfikatory sesji mogą na przykład prowadzić do tworzenia ogromnej liczby duplikatów stron i zwiększenia liczby adresów URL.
-
Parametry sortowania. Witryny niektórych dużych sklepów internetowych pozwalają sortować te same towary na wiele sposobów, co prowadzi do powstania bardzo dużej liczby adresów URL. Na przykład:
https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- Nieistotne parametry w adresach URL, określające na przykład, z jakiej witryny pochodzi dany użytkownik. Na przykład:
https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- Problemy związane z kalendarzami. Kalendarz generowany dynamicznie może zawierać linki do przyszłych i wcześniejszych dat bez żadnych ograniczeń. Na przykład:
https://example.com/calendar.php?d=13&m=8&y=2011
- Niedziałające linki względne. Niedziałające linki względne mogą powodować tworzenie nieskończenie dużej przestrzeni. Przyczyną tego problemu są często powtarzające się fragmenty ścieżek. Na przykład:
https://example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
Rozwiązywanie problemów z adresami URL
Aby uniknąć potencjalnych problemów ze strukturą adresów URL, zalecamy podjęcie tych działań:
- Utwórz prostą strukturę adresów URL. Warto rozważyć uporządkowanie treści w taki sposób, aby adresy URL były logicznie skonstruowane i czytelne dla użytkowników.
- Rozważ użycie pliku robots.txt, aby zablokować dostęp Googlebota do problematycznych adresów URL. Zazwyczaj blokuje się dynamiczne adresy URL, takie jak adresy generujące wyniki wyszukiwania oraz adresy tworzące nieskończenie dużą przestrzeń do indeksowania (np. kalendarze). Użycie w pliku robots.txt wyrażeń regularnych pozwala łatwo zablokować dużą liczbę adresów URL.
- Gdy tylko jest to możliwe, unikaj stosowania identyfikatorów sesji w adresach URL. Możesz je zastąpić plikami cookie.
- Jeśli serwer WWW nie rozróżnia wielkich i małych liter w adresie URL, zastosuj w całym tekście litery tej samej wielkości. Ułatwi to Google ustalenie, czy adresy URL wskazują tę samą stronę.
- Zawsze, gdy jest to możliwe, skracaj adresy URL, usuwając niepotrzebne parametry.
-
Jeśli witryna ma kalendarz bez daty końcowej, dodaj do linków tworzących kolejne strony kalendarza atrybut
nofollow
. - Sprawdź, czy w witrynie nie ma niedziałających linków względnych.