การศึกษาเปรียบเทียบ WebP, JPEG และ JPEG 2000, กันยายน 2010
หมายเหตุ: เราได้ทำการศึกษาขั้นต้นนี้โดยใช้ WebP เวอร์ชันแรก
ที่เราเปิดตัว แต่ใช้ไลบรารี libvpx
นอกจากนี้ แหล่งข้อมูล
รูปภาพเป็นภาพ JPEG ที่เรารวบรวมข้อมูลจากเว็บ อิงตามความคิดเห็นจาก
กับชุมชน เราจึงได้ดำเนินการ
การศึกษาใหม่ ที่มี libwebp
เวอร์ชัน 0.1.2
เริ่มจากรูปภาพแบบไม่สูญเสียรายละเอียด (PNG) เป็นต้นฉบับ การศึกษาใหม่มีผลแทนการศึกษา
การศึกษา
ทีม WebP ทำการศึกษาเปรียบเทียบวิธีบีบอัดรูปภาพ 3 วิธี จากชุดภาพแบบสุ่มจำนวน 1 ล้านภาพ เป้าหมายของการศึกษาคือการวัด การบีบอัดที่ได้รับจากวิธีการเหล่านั้น และเพื่อวิเคราะห์ข้อดีข้อเสีย ระหว่างขนาดรูปภาพและการบีบอัด
วิธีบีบอัดมี 3 วิธี ได้แก่ WebP, JPEG 2000 และ Re-JPEG ภาพ JPEG 900,000 ภาพที่มีอยู่ในชุดข้อมูล บีบอัดรูปภาพ JPEG ใหม่แล้ว พร้อม Re-JPEG เพื่อให้แต่ละภาพอยู่ใกล้กับยอดเขาเป้าหมายมากที่สุด ค่าอัตราส่วนสัญญาณต่อสัญญาณรบกวน (PSNR) ทีมดำเนินการวิเคราะห์รูปภาพเหล่านี้ หลังจากบีบอัดแล้ว
นอกจากการศึกษาในสเกลใหญ่แล้ว ทีมงานยังตรวจสอบการสุ่ม 100 ครั้ง รูปภาพ และพบว่า WebP มักให้คุณภาพของภาพที่ยอมรับได้
บทสรุป
WebP มีการบีบอัดโดยรวมสูงกว่า JPEG หรือ JPEG 2000 กำไร ในขนาดไฟล์ที่เล็กที่สุด จะสูงเป็นพิเศษ สำหรับภาพขนาดเล็ก ส่วนขยายที่พบบ่อยที่สุดบนเว็บ
ชุดข้อมูล
ชุดข้อมูลที่ใช้ในการศึกษาคือคอลเล็กชันรูปภาพ 1 ล้านรูปแบบสุ่ม สุ่มตัวอย่างจากที่เก็บรูปภาพที่มีการ Crawl จากเว็บ ตารางต่อไปนี้ แสดงการกระจายของรูปภาพประเภทต่างๆ ในชุดข้อมูล
ประเภท | จำนวน |
---|---|
JPEG | ประมาณ 9 แสน |
PNG | ประมาณ 4.7 หมื่น |
GIF | ประมาณ 4.7 หมื่น |
อื่นๆ | ประมาณ 6 พัน |
การออกแบบการทดลอง
การทดสอบมีการทำงานเป็น 2 ขั้นตอน ดังนี้
ทีมใช้ WebP กับรูปภาพโดยมี PSNR เป้าหมายอยู่ที่ 42 พวกเขาปรับแก้ พารามิเตอร์คุณภาพ (QP) สำหรับโปรแกรมเปลี่ยนไฟล์ WebP จนกว่าจะได้ผลลัพธ์ ได้เข้าใกล้ 42 เท่าที่จะได้รูปภาพหนึ่งๆ ฟิลด์ PSNR สําหรับแต่ละรูปภาพ ดังนั้น ไม่จำเป็นว่าจะต้อง 42 พอดี
ทีมใช้ค่า PSNR สำหรับรูปภาพที่บีบอัดโดย WebP เป็นเป้าหมาย PSNR สำหรับรูปภาพ JPEG 2000 และ Re-JPEG และยังวาดเส้น ค้นหาพารามิเตอร์คุณภาพของ JPEG 2000 และ JPEG เพื่อให้ใกล้เคียงกับ PSNR เป้าหมายมากที่สุด
ผลการบีบอัดจริงวัดเป็นเปอร์เซ็นต์โดยใช้ข้อมูลต่อไปนี้ สูตร:
compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length
ผลลัพธ์
การทดสอบแสดงผลลัพธ์ต่อไปนี้สำหรับผลลัพธ์ที่ไม่เป็นลบและไม่เป็นลบ จำนวนการบีบอัดที่เพิ่มขึ้น:
อัตราการบีบอัดที่ไม่ติดลบ
ทีมไม่ได้ลงโทษวิธีการหากวิธีการดังกล่าวทำให้ขนาดรูปภาพเพิ่มขึ้น หลังการบีบอัด ซึ่งก็คือ ค่าการบีบอัด _percentage เป็น 0 เมื่อ Composite_image.length มากกว่า Original_image.length
ค่าลบการบีบอัด
ทีมได้อนุญาตให้ใช้ผลเปอร์เซ็นต์การบีบอัดที่ติดลบ ความเข้าใจเกี่ยวกับคอมเพรสเซอร์แบบต่างๆ ประสิทธิภาพดิบ
ต่อไปนี้คือเปอร์เซ็นต์การบีบอัดเฉลี่ยที่ได้จากการเข้าชมแต่ละครั้ง จากทั้ง 3 วิธี
ประเภท | PSNR เฉลี่ยที่ได้รับ | % การบีบอัดเฉลี่ย (อัตราการบีบอัดที่ไม่เป็นลบ) |
การบีบอัดเฉลี่ย % (อัตราขยายเสียงเป็นลบ) |
---|---|---|---|
WebP | 39.38 | 41.30 | 398.00 |
JPEG 2000 | 39.49 | 27.67 | 9.71 |
Re-JPEG | 39.36 | 37.20 | 14.62 |
เมื่ออนุญาตการบีบอัดแบบติดลบ ประสิทธิภาพโดยเฉลี่ยของ JPEG 2,000 ต่ำกว่าค่า JPEG ซึ่งอาจเกิดจากอาร์ติแฟกต์ความถี่สูง ปรากฏในรูปภาพ JPEG อาร์ติแฟกต์เหล่านี้จะทำให้เกิด สถานการณ์การบีบอัดที่น้อยกว่าที่ต้องการ
การติดตั้งใช้งาน Kakadu ที่ใช้ในการทดลองเพื่อแปลงเป็น JPEG 2000 ไม่สามารถแปลงรูปภาพประมาณ 240,000 รูป
JPEG 2000 มีเปอร์เซ็นต์การบีบอัดต่ำกว่า Re-JPEG โดยมีสาเหตุหลักดังนี้ ผลลัพธ์ของ JPEG 2000 คือการบีบอัดเชิงลบสําหรับรูปภาพจํานวนมาก สำหรับกรณีนี้ รูปภาพ JPEG มีคะแนนการบีบอัดโดยรวมต่ำกว่า
ตัวเลขต่อไปนี้แสดงกราฟการกระจายสำหรับ 3 วิธี:
รูปที่ 1: การกระจายประชากรของขนาดรูปภาพ
กราฟแสดงให้เห็นว่ารูปภาพส่วนใหญ่มีขนาดเล็ก ความถี่ของฟิลด์ รูปภาพที่มีขนาดเกิน 500K โดยทั่วไปจะน้อยกว่า 100 รูป
รูปที่ 2: เปอร์เซ็นต์การบีบอัดของรูปภาพ WebP, JPEG และ JPEG 2000
กราฟนี้แสดงให้เห็นว่าเนื้อหาของรูปภาพที่บีบอัดด้วย WebP และบีบอัดได้ดีกว่า re-jpeg และ jpeg 2000 และรูปภาพที่บีบอัด โดย WebP ได้รับการบีบอัดเป็นบวกมากกว่ารายการอื่นๆ
รูปที่ 3: การเปรียบเทียบขนาดรูปภาพและเปอร์เซ็นต์การบีบอัด
กราฟนี้แสดงให้เห็นว่า WebP มีการบีบอัดที่ดีกว่ารูปแบบอื่นๆ โดยเฉพาะรูปภาพขนาดเล็ก