Studi komparatif WebP, JPEG, dan JPEG 2000, September 2010
Catatan: Kami telah melakukan studi awal ini dengan versi pertama WebP
yang kami rilis, yang menggunakan library libvpx
. Selain itu, gambar sumber adalah gambar JPEG yang kami crawl dari Web. Berdasarkan masukan dari
komunitas, kami sekarang telah melakukan
studi baru dengan libwebp
versi 0.1.2
yang dimulai dengan gambar lossless (PNG) sebagai sumber. Studi baru menggantikan
penelitian ini.
Tim WebP melakukan studi komparatif terhadap tiga metode kompresi gambar pada kumpulan 1 juta gambar acak. Tujuan penelitian ini adalah untuk mengukur kompresi yang dicapai oleh metode tersebut dan menganalisis kompromi antara ukuran gambar dan kompresi.
Tiga metode kompresi, WebP, JPEG 2000, dan Re-JPEG,diterapkan pada 900.000 gambar JPEG yang terdapat dalam set data. Gambar JPEG dikompresi ulang dengan Re-JPEG sehingga masing-masing sedekat mungkin dengan nilai rasio sinyal-ke-noise target (PSNR). Analisis tim dilakukan pada gambar setelah dikompresi.
Selain studi berskala besar, tim secara manual memeriksa 100 gambar acak dan menemukan bahwa, dalam sebagian besar kasus, WebP memberikan kualitas visual yang dapat diterima.
Kesimpulan
WebP mencapai kompresi yang lebih tinggi secara keseluruhan daripada JPEG atau JPEG 2000. Peningkatan minimalisasi ukuran file sangat tinggi untuk gambar yang lebih kecil yang paling umum ditemukan di web.
Kumpulan Data
Set data yang digunakan dalam studi ini adalah koleksi 1 juta gambar yang diambil secara acak dari repositori gambar yang di-crawl dari web. Tabel berikut menunjukkan distribusi berbagai jenis gambar di set data.
Jenis | Jumlah |
---|---|
JPEG | ~900 RB |
PNG | ~47 RB |
GIF | ~47 RB |
Lainnya | ~6 RB |
Desain Eksperimen
Eksperimen dijalankan dalam dua tahap:
Tim menjalankan WebP pada gambar dengan target PSNR 42. Mereka menyesuaikan parameter kualitas (QP) untuk encoder WebP hingga mencapai hasil yang mendekati 42 yang bisa didapatkan untuk gambar tertentu. Oleh karena itu, PSNR aktual yang dicapai untuk setiap gambar belum tentu tepat 42.
Tim ini menggunakan nilai PSNR untuk gambar yang dikompresi WebP sebagai PSNR target untuk gambar JPEG 2000 dan Re-JPEG. Mereka juga melakukan penelusuran baris pada parameter kualitas gambar JPEG 2000 dan JPEG untuk mendapatkan hasil sedekat mungkin dengan PSNR target.
Hasil kompresi sebenarnya diukur sebagai persentase menggunakan formula berikut:
compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length
Hasil
Pengujian ini memberikan hasil berikut untuk perolehan kompresi negatif dan non-negatif:
Perolehan Kompresi Non-negatif
Tim tidak menghukum metode jika metode tersebut meningkatkan ukuran gambar setelah kompresi. Artinya, compression_percentage dianggap 0 jika terkompresi_image.length lebih besar dari original_image.length.
Perolehan Kompresi Negatif
Tim ini mengizinkan hasil persentase kompresi negatif untuk mendapatkan pemahaman yang lebih baik tentang performa mentah berbagai kompresor.
Berikut adalah persentase kompresi rata-rata yang dicapai oleh ketiga metode tersebut.
Jenis | Rata-rata PSNR yang Diperoleh | Rata-rata Kompresi % (perolehan kompresi non-negatif) |
Rata-rata Kompresi % (perolehan kompresi negatif) |
---|---|---|---|
WebP | 39,38 | 41.30 | 39,80 |
JPEG 2000 | 39,49 | 27.67 | 9.71 |
JPEG ulang | 39,36 | 22.37 | 14.62 |
Jika perolehan kompresi negatif diizinkan, performa rata-rata untuk JPEG 2000 lebih rendah daripada JPEG. Hal ini mungkin karena artefak frekuensi tinggi yang ada dalam gambar JPEG; artefak ini dapat berkontribusi pada situasi kompresi yang kurang ideal.
Implementasi Kakadu yang digunakan dalam eksperimen untuk dikonversi ke JPEG 2000 gagal mengonversi sekitar 240.000 gambar.
JPEG 2000 memiliki persentase kompresi lebih rendah daripada Re-JPEG, terutama karena hasil JPEG 2000 adalah kompresi negatif untuk banyak gambar. Oleh karena itu, gambar JPEG mencapai skor kompresi keseluruhan yang lebih rendah.
Gambar berikut memberikan grafik distribusi untuk ketiga metode:
Gambar 1: Distribusi Populasi Ukuran Gambar
Grafik menunjukkan bahwa sebagian besar gambar berukuran kecil. Frekuensi gambar dengan ukuran lebih dari 500 K biasanya kurang dari 100.
Gambar 2: Persentase Kompresi untuk Gambar WebP, JPEG, dan JPEG 2000
Grafik ini menunjukkan bahwa isi gambar yang dikompresi dengan WebP mendapatkan kompresi yang lebih baik daripada re-jpeg dan jpeg 2000. Gambar yang dikompresi dengan WebP juga mendapat kompresi yang lebih positif daripada yang lain.
Gambar 3: Perbandingan Ukuran Gambar dan Persentase Kompresi
Grafik ini menunjukkan bahwa WebP mencapai kompresi yang lebih baik daripada format lainnya, terutama untuk gambar yang lebih kecil.