Estudo comparativo de WebP, JPEG e JPEG 2000, setembro de 2010
Observação:realizamos esse estudo inicial com a primeira versão do WebP
que lançamos, que usou a biblioteca libvpx
. Além disso, as imagens de origem eram imagens JPEG que rastreiamos da Web. Com base no feedback
da comunidade, realizamos um
novo estudo com a versão 0.1.2 de libwebp
começando com imagens sem perdas (PNG) como origem. O novo estudo substitui este.
A equipe do WebP realizou um estudo comparativo de três métodos de compactação de imagens em um conjunto aleatório de 1 milhão de imagens. Os objetivos do estudo foram medir a compressão alcançada por esses métodos e analisar as compensações entre tamanhos de imagem e compactação.
Três métodos de compactação, WebP, JPEG 2000 e Re-JPEG, foram aplicados às 900.000 imagens JPEG contidas no conjunto de dados. As imagens JPEG foram recompactadas com Re-JPEG para que cada uma estivesse o mais próximo possível de um valor máximo de proporção sinal-ruído (PSNR, na sigla em inglês) desejado. A análise da equipe foi feita nas imagens depois que elas foram compactadas.
Além do estudo em grande escala, a equipe inspecionou manualmente 100 imagens aleatórias e descobriu que, na maioria dos casos, o WebP fornece qualidade visual aceitável.
Conclusões
O formato WebP atinge uma compressão geral mais alta do que JPEG ou JPEG 2000. Os ganhos na minimização do tamanho do arquivo são particularmente altos para imagens menores, que são as mais comuns encontradas na Web.
Conjunto de dados
O conjunto de dados usado no estudo foi uma coleção de 1 milhão de imagens amostradas aleatoriamente de um repositório de imagens rastreadas da Web. A tabela a seguir mostra a distribuição de diferentes tipos de imagens no conjunto de dados.
Tipo | Count |
---|---|
JPEG | Aprox. 900 mil |
PNG | Aprox. 47 mil |
GIF | Aprox. 47 mil |
Outros | Cerca de 6 mil |
Design do experimento
Os experimentos foram realizados em duas etapas:
A equipe executou o WebP nas imagens com um PSNR 42. Eles ajustaram o parâmetro de qualidade (QP) para o codificador WebP até alcançar um resultado o mais próximo possível de 42 para uma determinada imagem. Portanto, o PSNR real alcançado para cada imagem não era necessariamente exatamente 42.
A equipe usou o valor da PSNR para as imagens compactadas por WebP como o PSNR de destino para as imagens JPEG 2000 e Re-JPEG. A empresa também realizou uma pesquisa linear sobre os parâmetros de qualidade das imagens JPEG 2000 e JPEG para chegar o mais próximo possível do PSNR de destino.
O resultado real da compactação foi medido como uma porcentagem usando a seguinte fórmula:
compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length
Resultados
Os testes produziram os seguintes resultados para ganho de compactação negativo e não negativo:
Ganho de compactação não negativo
A equipe não penalizou um método que aumentasse o tamanho da imagem após a compactação. Ou seja, compression_percentage foi considerada 0 quando o valor de compact_image.length for maior que o original_image.length.
Ganho de compactação negativo
A equipe permitiu resultados negativos de porcentagem de compressão para entender melhor o desempenho bruto dos vários compressores.
Veja a seguir as porcentagens médias de compactação alcançadas por cada um dos três métodos.
Tipo | PSNR média obtida | % média de compressão (ganho de compactação não negativo) |
% de compressão média (ganho de compactação negativo) |
---|---|---|---|
WebP | 39,38 | 41.30 | 39,80 |
JPEG 2000 | 39,49 | 27.67 | 9.71 |
Re-JPEG | 39,36 | 22.37 | 14.62 |
Quando o ganho de compactação negativo era permitido, o desempenho médio do JPEG 2000 era menor do que o do JPEG. Isso pode ocorrer devido a artefatos de alta frequência presentes nas imagens JPEG. Esses artefatos podem contribuir para uma situação de compactação abaixo do ideal.
A implementação do Kakadu usada no experimento para converter para JPEG 2000 não conseguiu converter aproximadamente 240.000 imagens.
O JPEG 2000 teve porcentagens de compactação mais baixas do que o Re-JPEG, principalmente porque o resultado do JPEG 2000 foi uma compactação negativa para muitas imagens. Por esse motivo, as imagens JPEG alcançaram uma pontuação de compactação geral menor.
As figuras a seguir mostram gráficos de distribuição para os três métodos:
Figura 1: distribuição populacional do tamanho da imagem
O gráfico mostra que a maioria das imagens era pequena. A frequência das imagens com tamanho superior a 500 K geralmente é inferior a 100.
Figura 2: porcentagens de compactação para imagens WebP, JPEG e JPEG 2000
Este gráfico demonstra que o corpo de imagens compactadas com WebP foi compactada melhor do que as imagens rejpeg e jpeg 2000. Além disso, as imagens compactadas com WebP receberam uma compactação mais positiva do que as outras.
Figura 3: comparação dos tamanhos das imagens e da porcentagem de compactação
Este gráfico mostra que o WebP atinge uma compressão melhor do que os outros formatos, principalmente para imagens menores.