ข้อผิดพลาด 404 จะสร้างความเสียหายต่อเว็บไซต์ของฉันไหม

วันจันทร์ที่ 2 พฤษภาคม 2011

คุณกำลังใช้เครื่องมือของผู้ดูแลเว็บเพื่อดูว่าเว็บไซต์คุณเจ๋งแค่ไหน... แต่เดี๋ยวนะ ทำไมหน้าข้อผิดพลาดจากการ Crawl เต็มไปด้วยข้อผิดพลาด 404 (Not found)! เกิดอะไรขึ้นกับเว็บไซต์ของฉันเนี่ย

ฟีเจอร์ข้อผิดพลาดจากการ Crawl ในเครื่องมือของผู้ดูแลเว็บ

ไม่ต้องตกใจไป มาดูกันว่าข้อผิดพลาด 404 มี (หรือไม่มี) ผลกระทบต่อเว็บไซต์ของคุณอย่างไร

ถาม: ข้อผิดพลาด 404 ที่รายงานในเครื่องมือของผู้ดูแลเว็บมีผลต่อการจัดอันดับเว็บไซต์ของฉันไหม
ตอบ: ข้อผิดพลาด 404 เป็นเรื่องปกติในเว็บ อินเทอร์เน็ตมีการเปลี่ยนแปลงอยู่ตลอดเวลา มีเนื้อหาเกิดใหม่ เนื้อหาเก่าจะตายไป และเมื่อไม่มีเนื้อหา ตามหลักการแล้วก็จะส่งโค้ด HTTP 404 ตอบกลับมา เครื่องมือค้นหารู้ดีถึงเรื่องนี้ เราเองก็มีข้อผิดพลาด 404 ในเว็บไซต์ของเรา อย่างที่คุณเห็นด้านบน และทั่วทั้งเว็บ ที่จริงแล้วเราอยากให้เป็นแบบนั้น เมื่อลบหน้าในเว็บไซต์ คุณต้องทำให้หน้านั้นแสดงโค้ดตอบกลับ 404 หรือ 410 (ไม่ควรใช้ soft 404) โปรดทราบว่าหากจะให้ Crawler ของเราเห็นโค้ดตอบกลับ HTTP ของ URL, Crawler จะต้องทำการ Crawl URL นั้นได้ หากคุณให้ไฟล์ robots.txt บล็อก URL ดังกล่าว เราจะทำการ Crawl ไม่ได้ และจะไม่เห็นโค้ดตอบกลับ การที่ URL บางรายการในเว็บไซต์ไม่มีแล้ว หรือแสดงข้อผิดพลาด 404 จะไม่ส่งผลต่อ URL อื่นๆ ของเว็บไซต์ (URL ที่แสดงผลรหัสสถานะ 200 (Success)) ในผลการค้นหาของเรา

ถาม: ข้อผิดพลาด 404 ไม่เป็นอันตรายต่อเว็บไซต์ของฉันเลยใช่ไหม
ตอบ: หาก URL บางรายการในเว็บไซต์ของคุณเป็น 404 แค่เรื่องนี้จะไม่มีผลต่อคุณหรือในผลการค้นหาของ Google อย่างไรก็ตาม อาจมีเหตุผลอื่นๆ ที่คุณต้องแก้ไขข้อผิดพลาด 404 บางประเภท เช่น หากหน้าเว็บบางหน้าที่เป็น 404 เป็นหน้าเว็บที่คุณเป็นห่วงจริงๆ ก็ควรดูสาเหตุที่เราพบข้อผิดพลาด 404 เมื่อทำการ Crawl หากคุณเห็นการสะกดคําผิดของ URL ที่ยังใช้อยู่ (เช่น www.example.com/awsome แทนที่จะเป็น www.example.com/awesome) อาจเป็นไปได้ว่ามีคนเจตนาจะลิงก์ไปยังคุณและแกล้งพิมพ์ผิด แทนที่จะแสดง 404 คุณอาจทำการเปลี่ยนเส้นทาง 301 URL ที่สะกดผิดไปยัง URL ที่ถูกต้องและดูเจตนาการเข้าชมจากลิงก์นั้น นอกจากนี้ คุณยังควรช่วยผู้ใช้ไปที่หน้า 404 ในเว็บไซต์ ให้ผู้ใช้พบสิ่งที่ต้องการได้ แทนที่จะแค่บอกว่า "404 ไม่พบ"

ถาม: อยากทราบข้อมูลเพิ่มเติมเกี่ยวกับ "ข้อผิดพลาด soft 404"
ตอบ: soft 404 จะแสดงเมื่อเว็บเซิร์ฟเวอร์ส่งโค้ดตอบกลับที่ไม่ใช่ 404 (หรือ 410) สําหรับ URL ที่ไม่มีอยู่ ตัวอย่างที่พบได้บ่อยคือเจ้าของเว็บไซต์ต้องการแสดงหน้า 404 พร้อมข้อมูลที่เป็นประโยชน์สําหรับผู้ใช้ และคิดว่าถ้าเว็บไซต์จะแสดงเนื้อหาแก่ผู้ใช้ ก็ต้องส่งโค้ดตอบกลับ 200 แต่ไม่ใช่อย่างนั้น คุณใช้โค้ดตอบกลับ 404 ได้ และขณะเดียวกันก็แสดงเนื้อหาที่ต้องการได้ด้วย อีกตัวอย่างหนึ่งคือเมื่อเว็บไซต์เปลี่ยนเส้นทาง URL ที่ไม่รู้จักไปยังหน้าแรกแทนที่จะแสดงข้อผิดพลาด 404 ทั้งสองกรณีนี้จะส่งผลเสียต่อความเข้าใจและการจัดทําดัชนีเว็บไซต์ ดังนั้นเราขอแนะนําให้ตรวจสอบว่าเซิร์ฟเวอร์ของคุณแสดงโค้ดตอบกลับที่เหมาะสมสําหรับเนื้อหาที่ไม่มีอยู่จริง โปรดทราบว่าแค่หน้าเว็บบอกว่า "404 ไม่พบ" อาจไม่ได้หมายความว่ามีการส่งโค้ดตอบกลับ HTTP 404 จริงๆ ให้คุณใช้ฟีเจอร์โปรแกรม Googlebot จําลอง ในเครื่องมือของผู้ดูแลเว็บเพื่อตรวจสอบให้แน่นอนอีกครั้ง หากไม่ทราบว่าจะกําหนดค่าเซิร์ฟเวอร์ให้แสดงรหัสตอบกลับที่เหมาะสมอย่างไร โปรดดูเอกสารประกอบความช่วยเหลือของโฮสต์เว็บของคุณ

ถาม: ฉันจะทราบได้อย่างไรว่า URL ควรเป็น 404 หรือ 301 หรือ 410
ตอบ: เมื่อคุณนำหน้าออกจากเว็บไซต์ ให้คิดว่าจะมีการย้ายเนื้อหาไปไว้ที่อื่นไหม หรือคุณไม่คิดจะมีเนื้อหาประเภทนี้ในเว็บไซต์อีกต่อไป หากคุณจะย้ายเนื้อหานั้นไปยัง URL ใหม่ คุณควรใช้การเปลี่ยนเส้นทาง 301 URL เก่าไปยัง URL ใหม่ ซึ่งจะทําให้ระบบเปลี่ยนเส้นทางผู้ใช้ที่เข้ามายัง URL เก่าเพื่อค้นหาเนื้อหาดังกล่าวไปยังหน้าที่เกี่ยวข้องกับสิ่งที่ผู้ใช้กําลังค้นหาโดยอัตโนมัติ หากคุณจะทิ้งเนื้อหาดังกล่าวไปเลยและไม่มีเนื้อหาอื่นบนเว็บไซต์ที่จะตอบความต้องการเดียวกันนี้ให้แก่ผู้ใช้ได้ เช่นนั้น URL เก่าก็ควรแสดงผล 404 หรือ 410 ปัจจุบัน Google จะถือว่า 410 (Gone) เหมือนกับ 404 (Not found) จึงไม่สําคัญเลยว่าคุณจะส่งอย่างไหนกลับมา

ถาม: ข้อผิดพลาด 404 ส่วนใหญ่ของฉันเป็น URL แปลกๆ ที่ไม่เคยมีอยู่ในเว็บไซต์ เกิดอะไรขึ้น URL พวกนี้มาจากไหน
ตอบ: หาก Google พบลิงก์ที่ไหนสักแห่งในเว็บที่ชี้ไปยัง URL ในโดเมนของคุณ Google อาจพยายามทำการ Crawl ลิงก์นั้นไม่ว่าจะมีเนื้อหาอยู่จริงหรือไม่ก็ตาม และเมื่อ Google ทำการ Crawl, เซิร์ฟเวอร์ของคุณก็ควรแสดง 404 หากไม่พบอะไร ลิงก์เหล่านี้อาจเกิดขึ้นจากการพิมพ์ผิดเมื่อมีคนลิงก์ไปหาคุณ การกําหนดค่าบางประเภทไม่ถูกต้อง (หากลิงก์สร้างขึ้นโดยอัตโนมัติโดย CMS) หรือความพยายามของ Google ที่จะรู้จักคุณและทําการ Crawl ลิงก์ที่ฝังใน JavaScript หรือเนื้อหาที่ฝังไว้อื่นๆ หรืออาจเป็นส่วนหนึ่งของการตรวจสอบอย่างรวดเร็วจากฝั่งเราเองเพื่อดูว่าเซิร์ฟเวอร์ของคุณจัดการ URL ที่ไม่รู้จักอย่างไร เหล่านี้เป็นต้น หากคุณเห็นข้อผิดพลาด 404 รายงานอยู่ในเครื่องมือของผู้ดูแลเว็บสําหรับ URL ที่ไม่มีอยู่ในเว็บไซต์ คุณไม่ต้องสนใจ URL เหล่านั้นก็ได้ เราไม่รู้ว่า URL ใดมีความสําคัญสําหรับคุณ กับไม่รู้ว่า URL ใดที่ควรจะแสดง 404 ดังนั้น เราจึงแสดงข้อผิดพลาด 404 ทั้งหมดที่พบในเว็บไซต์ของคุณ และให้คุณเป็นคนตัดสินใจว่า URL รายการใด (หากมี) ที่ควรต้องตรวจสอบ

ถาม: มีคนคัดลอกเนื้อหาเว็บไซต์ของฉันและทําให้เกิดข้อผิดพลาด 404 จํานวนมาก URL เหล่านี้เป็น URL "จริง" ทั้งหมดที่มีโค้ดอื่นๆ ติดอยู่ เช่น https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/> กรณีนี้จะส่งผลกระทบต่อเว็บไซต์ของฉันไหม
ตอบ: โดยทั่วไป คุณไม่ต้องกังวลเลยว่า "ลิงก์เสีย" อย่างนี้จะส่งผลเสียต่อเว็บไซต์ เราเข้าใจว่าเจ้าของเว็บไซต์ควบคุมอะไรได้น้อยมากสำหรับพวกที่คัดลอกเนื้อหาเว็บไซต์ หรือพวกที่ลิงก์เนื้อหาด้วยวิธีการแปลกๆ หากคุณเชี่ยวชาญเรื่อง regex ก็อาจลองใช้การเปลี่ยนเส้นทาง URL เหล่านี้ แต่โดยทั่วไปแล้วไม่มีอะไรต้องกังวล นอกจากนี้ คุณสามารถส่งคําขอให้ลบออกได้เมื่อเชื่อว่ามีคนขโมยเนื้อหาต้นฉบับจากเว็บไซต์ของคุณ

ถาม: สัปดาห์ที่ผ่านมาฉันแก้ไขข้อผิดพลาด 404 ทั้งหมดที่ Search Console รายงาน แต่ข้อผิดพลาดเหล่านั้นยังคงอยู่ในบัญชี นี่หมายความว่าฉันไม่ได้แก้ไขอย่างถูกต้องใช่ไหม ต้องใช้เวลานานเท่าใดกว่าที่ข้อผิดพลาดดังกล่าวจะหายไป
ตอบ: ดูคอลัมน์ "ตรวจพบ" ในหน้าข้อผิดพลาดจากการ Crawl ซึ่งเป็นวันที่ล่าสุดที่เราตรวจพบข้อผิดพลาดแต่ละรายการ หากวันที่ในคอลัมน์เป็นวันที่ก่อนที่คุณจะแก้ไขข้อผิดพลาด แสดงว่าเราไม่พบข้อผิดพลาดเหล่านี้ตั้งแต่วันที่ดังกล่าว หากเป็นวันที่หลังจากนั้น แสดงว่าเรายังคงพบข้อผิดพลาด 404 เหล่านี้อยู่เมื่อทำการ Crawl

หลังจากแก้ไขแล้ว คุณสามารถตรวจสอบได้ว่า Crawler ของเราเห็นโค้ดตอบกลับใหม่หรือไม่โดยใช้โปรแกรม Googlebot จําลอง ทำการทดสอบ 2-3 URL หากเห็นว่าถูกต้องแล้ว ข้อผิดพลาดเหล่านี้ควรจะเริ่มหายไปจากรายการข้อผิดพลาดจากการ Crawl

ถาม: ฉันจะใช้เครื่องมือนํา URL ออกของ Google เพื่อทําให้ข้อผิดพลาด 404 หายไปจากบัญชีของฉันได้เร็วขึ้นไหม
ตอบ: ไม่ เครื่องมือนํา URL ออกจะนํา URL ออกจากผลการค้นหาของ Google ไม่ใช่จากเครื่องมือของผู้ดูแลเว็บ ซึ่งออกแบบมาสําหรับคําขอนําออกแบบเร่งด่วนเท่านั้น และไม่จําเป็นต้องใช้หาก URL แสดง 404 อยู่แล้ว เพราะ URL ดังกล่าวจะหายไปจากผลการค้นหาอยู่แล้วเมื่อเวลาผ่านไป ดูรายละเอียดเพิ่มเติมเกี่ยวกับสิ่งที่เครื่องมือนํา URL ออกทําได้และทำไม่ได้ที่ครึ่งล่างของบล็อกโพสต์นี้

หากยังต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับข้อผิดพลาด 404 โปรดไปที่สัปดาห์ 404 จากบล็อก หรือไปที่ฟอรัมความช่วยเหลือสำหรับผู้ดูแลเว็บ