معرفی
ما یک ارزیابی مقایسه ای از فشرده سازی تصویر WebP و JPEG بر اساس رمزگذار جدیدی که در libwebp
منتشر کردیم، انجام می دهیم. هدف اجرای مجموعهای از آزمایشهای قابل تکرار با استفاده از ابزارهای عمومی و مقایسه فشردهسازی تصویر بهدستآمده توسط WebP و JPEG است.
مطالعه مقایسه ای قبلی ما از WebP بر ارزیابی تعداد زیادی از تصاویر متمرکز بود و بر روی منابع JPEG که از وب خزیده شده بودند انجام شد. JPEG یک فرمت فشرده سازی با اتلاف است و مصنوعات فشرده سازی را به منبع معرفی می کند. علاوه بر این، ما در ابتدا از نسبت سیگنال به نویز پیک یا PSNR به عنوان معیار کیفیت استفاده کردیم. PSNR دارای معایبی است هنگامی که به عنوان معیار کیفیت تصاویر استفاده می شود. بر اساس بازخورد جامعه، ما آزمایشهایی را روی تصاویر PNG از جمله تصاویر موجود در چند مجموعه آزمایشی استاندارد انجام میدهیم. ما در این مطالعه از تشابه ساختاری یا SSIM به عنوان معیار کیفیت برای این مطالعه استفاده می کنیم. SSIM معیار کیفیت بصری بهتری در نظر گرفته می شود .
روش شناسی
ما دو نوع ارزیابی را شرح می دهیم. در مورد اول، فشرده سازی اضافی بدست آمده توسط WebP را در همان سطح کیفی JPEG مطالعه می کنیم. به طور خاص، ما تصاویر WebP با کیفیت مشابه تصاویر JPEG (بر اساس شاخص SSIM) تولید میکنیم و سپس اندازه فایلهای تصاویر WebP و JPEG را مقایسه میکنیم. در مورد دوم، نمودارهای SSIM در مقابل بیت در پیکسل (bpp) را برای WebP و JPEG تجزیه و تحلیل میکنیم. این نمودارها مبادله اعوجاج نرخ را برای WebP و JPEG نشان می دهد.
مجموعه دادههای آزمایشها شامل تصاویر PNG است. این تصاویر از مجموعههای تصویر تست استاندارد در دسترس عموم و همچنین مجموعه بزرگی از تصاویر PNG که از وب خزیده شدهاند، به دست آمدهاند.
هر آزمایش شامل اجرای مجموعه ای از دستورات است. فقط از ابزارهای خط فرمان در دسترس عموم استفاده میشود تا آزمایشها را بهطور منطقی برای دیگران قابل تکرار نگه دارند. ابزارهای خط فرمان مورد استفاده برای این آزمایش عبارتند از:
identify
وconvert
ابزارهای خط فرمان هستند که بخشی از ImageMagick هستند. ما برای این تحلیل از نسخه 6.5.7 استفاده کردیم. ما ازconvert
برای تبدیل بین فرمت های PNG و PPM استفاده کردیم. ما ازidentify
برای استخراج اطلاعات عرض و ارتفاع یک تصویر استفاده کردیم.cwebp
وdwebp
ابزارهای خط فرمان هستند که بخشی از کتابخانهlibwebp
هستند که در سه ماهه اول 2011 منتشر کردیم. ما از نسخه 0.1.2 کتابخانه استفاده کردیم. ما ازcwebp
وdwebp
برای رمزگذاری و رمزگشایی تصاویر WebP استفاده کردیم. ما از پارامترهای رمزگشایی و رمزگشایی پیشفرض این ابزارها استفاده کردیم.cjpeg
وdjpeg
ابزارهای خط فرمان هستند که بخشی از کتابخانهlibjpeg
هستند. ما از نسخه 6b کتابخانه استفاده کردیم. ما ازcjpeg
وdjpeg
برای رمزگذاری و رمزگشایی تصویر JPEG استفاده کردیم. ما ازcjpeg
با پرچم-optimize
برای بهینه سازی اندازه فایل استفاده کردیم. ما تمام پارامترهای دیگر را به مقادیر پیش فرض آنها تنظیم می کنیم.
کیفیت تصویر با استفاده از SSIM اندازه گیری شد. همانطور که قبلا ذکر شد، SSIM به طور کلی به عنوان یک معیار کیفیت بهتر از PSNR پذیرفته شده است. برای محاسبه شاخص SSIM، ما از یک پیاده سازی در دسترس عموم در C++ استفاده کردیم. خواننده ممکن است اسکریپتهای پایتون را که در آزمایشها استفاده کردهایم از مخزن کد برای مرجع دانلود کند.
مجموعه داده های تصویری
ما مجموعه دادهها را برای ارزیابی مجموعههای تصویر آزمایشی استاندارد و همچنین روی مجموعه بزرگی از تصاویر انتخاب کردیم. در زیر لیستی از مجموعه داده های مورد استفاده در آزمایش ها آمده است.
Lenna: تصویر Lenna پرکاربرد (512 x 512 پیکسل).
کداک: 24 تصویر از مجموعه تصاویر رنگی واقعی کداک .
Tecnick: 100 تصویر از مجموعه موجود در Tecnick.com . ما از 100 تصویر رنگی RGB با اندازه اصلی استفاده کردیم.
Image_crawl: برای آزمایش تعداد زیادی تصویر، نمونهای تصادفی از تصاویر PNG را از پایگاه داده خزیدن وب جستجوی تصویر Google جمعآوری کردیم. بیشتر تصاویر PNG خزیده شده آیکون ها، گرافیک ها، نمودارها، اسناد اسکن شده و غیره هستند. با این حال بیشتر تصاویر در مجموعه های تست استاندارد به جای تصاویر تولید شده توسط کامپیوتر، مانند عکس هستند. برای اینکه این مجموعه داده از نظر ماهیت مشابه مجموعههای تست استاندارد باشد، یک الگوریتم تشخیص چهره را روی این تصاویر PNG اجرا کردیم و فقط آن دسته از تصاویر (حدود 11000) را برای این آزمایش در نظر گرفتیم که این تست تشخیص را گذراندهاند.
آزمایش 1: WebP در مقابل JPEG در شاخص SSIM برابر
در این آزمایش ما تصاویر JPEG و WebP را با مقادیر قابل مقایسه SSIM تولید می کنیم و نسبت اندازه فایل ها را اندازه گیری می کنیم. مراحل آزمایش به شرح زیر است:
تصویر PNG منبع را با پارامتر کیفیت ثابت Q به JPEG فشرده کنید و SSIM را بین تصویر PNG منبع و تصویر JPEG فشرده ضبط کنید.
همان تصویر منبع را با یک پارامتر کیفیت به WebP فشرده کنید که تا حد امکان به SSIM ثبت شده بالا برسد.
ما دو مرحله فوق را روی تمام تصاویر موجود در یک مجموعه داده اجرا کردیم و سپس میانگین اندازه فایل و SSIM را برای تصاویر JPEG و WebP اندازهگیری کردیم.
جداول زیر نتایج این آزمایش را برای سه مقدار مختلف (50، 75 و 95) پارامتر کیفیت JPEG Q نشان می دهد. پارامترهای کیفیت 50 و 95 به ترتیب فشرده سازی تصویر را در نرخ بیت پایین و بالا نشان می دهند. ما همچنین پارامتر کیفیت JPEG 75 را در نظر گرفتهایم زیرا سطح کیفی عمومی توصیه شده برای تصاویر JPEG است.
جدول 1: میانگین اندازه فایل برای WebP و JPEG برای نمایه یکسان SSIM مطابق با JPEG Q=50
لنا | کداک | تکنیک | Image_crawl | |
---|---|---|---|---|
WebP: متوسط اندازه فایل (سیم کارت متوسط) | 17.4 کیلوبایت (0.841) | 31.0 کیلوبایت (0.898) | 92.4 کیلوبایت (0.917) | 6.5 کیلوبایت (0.901) |
JPEG: اندازه فایل متوسط (سیم کارت متوسط) | 23.5 کیلوبایت (0.840) | 42.7 کیلوبایت (0.897) | 124.6 کیلوبایت (0.916) | 9.9 کیلوبایت (0.899) |
نسبت اندازه فایل WebP به JPEG | 0.74 | 0.72 | 0.74 | 0.66 |
جدول 2: میانگین اندازه فایل برای WebP و JPEG برای نمایه یکسان SSIM مطابق با JPEG Q=75
لنا | کداک | تکنیک | Image_crawl | |
---|---|---|---|---|
WebP: متوسط اندازه فایل (سیم کارت متوسط) | 26.7 کیلوبایت (0.864) | 46.5 کیلوبایت (0.932) | 139.0 کیلوبایت (0.939) | 9.9 کیلوبایت (0.930) |
JPEG: اندازه فایل متوسط (سیم کارت متوسط) | 37.0 کیلوبایت (0.863) | 66.0 کیلوبایت (0.931) | 191.0 کیلوبایت (0.938) | 14.4 کیلوبایت (0.929) |
نسبت اندازه فایل WebP به JPEG | 0.72 | 0.70 | 0.73 | 0.69 |
جدول 3: میانگین اندازه فایل برای WebP و JPEG برای نمایه یکسان SSIM مطابق با JPEG Q=95
لنا | کداک | تکنیک | Image_crawl | |
---|---|---|---|---|
WebP: متوسط اندازه فایل (سیم کارت متوسط) | 74.3 کیلوبایت (0.910) | 118.0 کیلوبایت (0.978) | 356.0 کیلوبایت (0.970) | 23.4 کیلوبایت (0.969) |
JPEG: اندازه فایل متوسط (سیم کارت متوسط) | 104 کیلوبایت (0.907) | 162 کیلوبایت (0.976) | 492 کیلوبایت (0.970) | 31.3 کیلوبایت (0.968) |
نسبت اندازه فایل WebP به JPEG | 0.71 | 0.73 | 0.72 | 0.75 |
از جداول بالا، میتوان مشاهده کرد که WebP در مقایسه با JPEG با شاخص SSIM برابر یا کمی بهتر، 25 تا 34 درصد افزایش فشردهسازی اضافی میدهد.
آزمایش 2: نمودارهای SSIM در مقابل BPP برای WebP و JPEG
ما مبادله نرخ-اعوجاج JPEG و WebP را مطالعه می کنیم. ما به طور خاص نمودارهای SSIM در مقابل بیت در پیکسل (bpp) را برای JPEG و WebP مطالعه می کنیم. تصویر منبع PNG را می گیریم، آن را با استفاده از تمام مقادیر کیفیت ممکن (0-100) به JPEG و WebP فشرده می کنیم. سپس برای هر مقدار کیفیت، SSIM و bpp به دست آمده برای JPEG و WebP را رسم می کنیم. شکل های زیر چنین نمودارهای SSIM در مقابل bpp را برای 3 تصویر انتخاب شده از 3 مجموعه داده عمومی که ما استفاده کرده ایم نشان می دهد.
شکل 1: SSIM در مقابل BPP برای Lenna
شکل 2: SSIM در مقابل BPP برای kodim19.png از مجموعه داده کداک
شکل 3: SSIM در مقابل BPP برای RGB_OR_1200x1200_061.png از مجموعه داده Tecnick
علاوه بر این، ما رفتار میانگین نمودار SSIM در مقابل bpp را برای مجموعه دادههای کداک و تکنیک مطالعه کردیم. برای ترسیم رفتار متوسط، تمام تصاویر موجود در یک مجموعه داده را با استفاده از WebP و JPEG در 100 مقدار کیفیت مختلف فشرده میکنیم. سپس میانگین SSIM و bpp را برای هر مقدار کیفیت رسم می کنیم. مجموعه داده خزیدن تصویر از تصاویر ناهمگنی تشکیل شده است که خود را به این تجمیع داده ها اختصاص نمی دهند. نمودارهای زیر میانگین رفتار SSIM و bpp را برای مجموعه داده های Kodak و Tecnick به ترتیب نشان می دهد.
شکل 4: SSIM در مقابل BPP برای مجموعه داده کداک
شکل 5: SSIM در مقابل BPP برای مجموعه داده Tecnick
به طور کلی، از نمودارهای بالا می توانیم مشاهده کنیم که WebP به طور مداوم به بیت های کمتری در هر پیکسل نسبت به JPEG برای دستیابی به شاخص SSIM یکسان نیاز دارد.
نتیجه
این مطالعه فشرده سازی WebP را در مقایسه با JPEG ارزیابی کرد. ما مشاهده کردیم که میانگین اندازه فایل WebP در مقایسه با اندازه فایل JPEG در شاخص SSIM معادل 25٪ -34٪ کوچکتر است. نمودارهای SSIM در مقابل bpp نشان داد که WebP به طور مداوم به بیتهای کمتری در هر پیکسل نسبت به JPEG برای همان شاخص SSIM نیاز دارد. این نتایج نشان می دهد که WebP می تواند بهبود فشرده سازی قابل توجهی را نسبت به JPEG ارائه دهد.
1 Huynh-Thu، Q. قنبری، م.(1387). "حوزه اعتبار PSNR در ارزیابی کیفیت تصویر/فیلم". نامه الکترونیک 44: 800-801.doi:10.1049/el:20080522.
2 Z. Wang، AC Bovik، HR Sheikh و EP Simoncelli، " ارزیابی کیفیت تصویر: از اندازه گیری خطا تا تشابه ساختاری "، پردازش تصویر، معاملات IEEE، جلد 13، شماره 4، صفحات 600-612، 2004.