แนวทางปฏิบัติแนะนําเกี่ยวกับโครงสร้าง URL สําหรับ Google

Google รองรับ URL ที่กําหนดโดย RFC 3986 อักขระที่กำหนดโดยมาตรฐานเป็นสงวนไว้ต้องเข้ารหัสด้วยเครื่องหมายเปอร์เซ็นต์ ระบบอาจทิ้งอักขระ ASCII ที่ไม่ได้สงวนไว้ในรูปแบบที่ไม่เข้ารหัส นอกจากนี้ อักขระในช่วงที่ไม่ใช่ ASCII ควรเข้ารหัสแบบ UTF-8

หากเป็นไปได้ ให้ใช้คำที่อ่านได้ใน URL แทนที่จะเป็นตัวเลขรหัสยาวๆ

แนะนำ: คําง่ายๆ ที่สื่อความหมายใน URL เช่น

https://en.wikipedia.org/wiki/Aviation

แนะนำ: คําแปลใน URL หากมี

https://www.example.com/lebensmittel/pfefferminz

แนะนำ: ใช้การเข้ารหัส UTF-8 ตามที่จำเป็น ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอักขระภาษาอาหรับใน URL

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอักขระภาษาจีนใน URL

https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอักขระ Umlaut ใน URL

https://www.example.com/gem%C3%BCse

ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอีโมจิใน URL

https://example.com/%F0%9F%A6%99%E2%9C%A8

ไม่แนะนำ: ใช้อักขระที่ไม่ใช่ ASCII ใน URL

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

ไม่แนะนำ: ตัวเลขรหัสยาวๆ ที่อ่านไม่ได้ใน URL เช่น

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

อย่าใช้ส่วนย่อยเพื่อเปลี่ยนเนื้อหาของหน้าเว็บ เนื่องจากโดยทั่วไป Google จะไม่รองรับ Fragment URL หากคุณใช้ JavaScript เพื่อเปลี่ยนเนื้อหา ให้ใช้ History API แทน

ไม่แนะนำ: Fragment URL เช่น

https://example.com/#/potatoes

หากเว็บไซต์เป็นแบบหลายภูมิภาค ให้พิจารณาใช้โครงสร้าง URL ที่ช่วยลดความยุ่งยากในการกำหนดเป้าหมายตามภูมิศาสตร์บนเว็บไซต์ ดูตัวอย่างเพิ่มเติมเกี่ยวกับวิธีจัดโครงสร้าง URL ได้ที่การใช้ URL ภาษาท้องถิ่น

แนะนำ: โดเมนเจาะจงประเทศ เช่น

https://example.de

แนะนำ: ไดเรกทอรีย่อยเจาะจงประเทศที่มี gTLD เช่น

https://example.com/de/

ลองใช้ขีดกลางเพื่อแยกคําใน URL เพราะช่วยให้ผู้ใช้และเครื่องมือค้นหาระบุแนวคิดใน URL ได้ง่ายขึ้น เราขอแนะนำให้ใช้ขีดกลางสั้น (-) แทนขีดล่าง (_) ใน URL

แนะนำ: ขีดกลาง (-) เช่น

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

ไม่แนะนำ: ขีดล่าง (_) เช่น

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

ไม่แนะนำ: คำใน URL ที่ต่อเข้าด้วยกัน เช่น

https://www.example.com/greendress

ปัญหาที่พบบ่อยเกี่ยวกับ URL

URL ที่ซับซ้อนเกินไป โดยเฉพาะ URL ที่มีพารามิเตอร์หลายตัว อาจทำให้เกิดปัญหาสำหรับโปรแกรมรวบรวมข้อมูลโดยสร้าง URL ซึ่งชี้ไปยังเนื้อหาที่เหมือนกันหรือคล้ายคลึงกันในเว็บไซต์ของคุณในจำนวนที่มากเกินจำเป็น ดังนั้น Googlebot อาจใช้แบนด์วิดท์เกินกว่าที่จำเป็นมาก หรืออาจจัดทำดัชนีเนื้อหาทั้งหมดในเว็บไซต์ได้ไม่สมบูรณ์

URL จำนวนมากที่ไม่มีความจำเป็นอาจเกิดจากปัญหาหลายประการด้วยกัน ซึ่งได้แก่

  • การกรองชุดของรายการที่เพิ่มเข้ามา เว็บไซต์หลายแห่งแสดงมุมมองที่แตกต่างกันสำหรับชุดรายการหรือผลการค้นหาเดียวกัน ซึ่งมักจะให้ผู้ใช้กรองชุดรายการนี้โดยใช้เกณฑ์ที่กำหนดไว้ (ตัวอย่างเช่น แสดงชื่อโรงแรมริมชายหาด) เมื่อสามารถรวมตัวกรองเข้าด้วยกันได้โดยการเพิ่มตัวกรองเข้ามา (ตัวอย่างเช่น โรงแรมริมชายหาดและมีศูนย์ออกกำลังกาย) จำนวน URL (มุมมองของข้อมูล) ในเว็บไซต์ก็จะเพิ่มสูงขึ้น การสร้างรายชื่อโรงแรมที่แตกต่างกันเล็กน้อยเป็นจำนวนมากถือเป็นเรื่องที่ซ้ำซ้อน เนื่องจาก Googlebot ต้องการเห็นรายชื่อเพียงจำนวนเล็กน้อยที่ทำให้สามารถเข้าถึงหน้าเว็บของโรงแรมแต่ละแห่งได้ ตัวอย่างเช่น
    • โรงแรม "ราคาพิเศษ":
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • โรงแรม "ราคาพิเศษ" ริมชายหาด:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • โรงแรม "ราคาพิเศษ" ริมชายหาดและมีศูนย์ออกกำลังกาย:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • การสร้างเอกสารแบบไดนามิก ซึ่งอาจทำให้เกิดการเปลี่ยนแปลงเพียงเล็กน้อยเนื่องจากตัวนับ การประทับเวลา หรือโฆษณา
  • พารามิเตอร์ที่มีปัญหาใน URL ตัวอย่างเช่น รหัสเซสชันอาจสร้าง URL ที่มีความซ้ำซ้อนกันและมีจำนวนมาก
  • พารามิเตอร์การจัดเรียง เว็บไซต์ช็อปปิ้งขนาดใหญ่บางแห่งมีวิธีจัดเรียงสินค้าที่เหมือนกันหลายวิธี ซึ่งทำให้มี URL จำนวนมากขึ้น เช่น
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • พารามิเตอร์ที่ไม่เกี่ยวข้องใน URL เช่น พารามิเตอร์อ้างอิง ตัวอย่าง
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • ปัญหาเกี่ยวกับปฏิทิน ปฏิทินที่สร้างแบบไดนามิกอาจสร้างลิงก์ไปยังวันที่ในอนาคตหรือวันที่ที่ผ่านมาแล้วโดยไม่มีข้อจำกัดสำหรับวันที่เริ่มต้นหรือวันสิ้นสุด ตัวอย่าง
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • ลิงก์แบบสัมพัทธ์ที่เสีย ลิงก์แบบสัมพัทธ์ที่เสียมักทำให้เกิดช่องว่างที่ไม่สิ้นสุด บ่อยครั้ง ปัญหานี้เกิดขึ้นเนื่องจากองค์ประกอบของเส้นทางที่ซ้ำกัน ตัวอย่าง
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

แก้ปัญหาที่เกี่ยวข้องกับ URL

ในการหลีกเลี่ยงปัญหาที่อาจเกิดขึ้นกับโครงสร้าง URL เราขอแนะนำดังนี้

  • สร้างโครงสร้าง URL แบบง่าย โปรดพิจารณาจัดระเบียบเนื้อหาเพื่อให้การสร้าง URL เป็นไปอย่างสมเหตุสมผลและมีลักษณะที่มนุษย์เข้าใจได้ง่ายที่สุด
  • โปรดพิจารณาใช้ไฟล์ robots.txt เพื่อบล็อก Googlebot ไม่ให้เข้าถึง URL ที่มีปัญหา โดยทั่วไปแล้ว ให้พิจารณาการบล็อก URL ที่ทำให้เกิดผลการค้นหาหรือมีการเว้นวรรคโดยไม่จำกัด เช่น ปฏิทิน การใช้นิพจน์ทั่วไปในไฟล์ robots.txt จะช่วยให้บล็อก URL จำนวนมากได้ง่ายขึ้น
  • หากเป็นไปได้ โปรดหลีกเลี่ยงการใช้รหัสเซสชันใน URL และพิจารณาใช้คุกกี้แทน
  • หากเว็บเซิร์ฟเวอร์ถือว่าข้อความตัวพิมพ์ใหญ่และตัวพิมพ์เล็กใน URL เป็นข้อความเดียวกัน ให้แปลงข้อความทั้งหมดเป็นตัวพิมพ์แบบเดียวกันเพื่อให้ Google ระบุว่า URL เหล่านั้นอ้างอิงหน้าเดียวกันได้ง่ายขึ้น
  • หากเป็นไปได้ โปรดทำให้ URL สั้นลงโดยตัดพารามิเตอร์ที่ไม่จำเป็นออก
  • หากเว็บไซต์มีปฏิทินที่ไม่จำกัด ให้เพิ่มแอตทริบิวต์ nofollow ให้กับลิงก์ไปยังหน้าปฏิทินในอนาคตซึ่งสร้างแบบไดนามิก
  • ตรวจสอบเว็บไซต์เพื่อหาลิงก์แบบสัมพัทธ์ที่เสีย