이 페이지는 Cloud Translation API를 통해 번역되었습니다.

WebP 무손실 비트스트림 사양

지르키 알라쿠이얄라 박사, Google, Inc., 2023년 3월 9일

개요

WebP 무손실은 ARGB 이미지의 무손실 압축을 위한 이미지 형식입니다. 무손실 형식은 완전히 투명한 픽셀의 색상 값을 비롯하여 픽셀 값을 정확하게 저장하고 복원합니다. 순차 데이터 압축을 위한 범용 알고리즘(LZ77), 접두사 코딩, 색상 캐시가 대량 데이터 압축에 사용됩니다. PNG보다 빠른 디코딩 속도와 오늘날의 PNG 형식을 사용하여 얻을 수 있는 것보다 25% 더 높은 압축률이 입증되었습니다.

1 소개

이 문서에서는 WebP 무손실 이미지의 압축된 데이터 표현을 설명합니다. 이 문서는 WebP 무손실 인코더와 애플리케이션 아키텍처의 살펴보겠습니다.

이 문서에서는 C 프로그래밍 언어 구문을 광범위하게 사용하여 비트스트림을 확인하고 비트를 읽는 함수가 있다고 가정합니다. ReadBits(n) 바이트는 이를 포함하는 스트림의 자연 순서로 읽히며 각 바이트의 비트는 최하위 비트 우선 순서로 읽힙니다. 날짜 여러 비트가 동시에 읽히고, 정수는 원본 데이터로 변환합니다 반환된 정수의 최상위 비트는 원래 데이터의 최상위 비트이기도 합니다. 따라서 문

b = ReadBits(2);

다음 두 문과 동일합니다.

b = ReadBits(1);
b |= ReadBits(1) << 1;

각 색상 구성요소, 즉 알파, 빨간색, 파란색, 녹색이 8비트 바이트를 사용하여 표현됩니다. 해당 유형을 uint8로 정의합니다. 전체 ARGB 픽셀은 32비트로 구성된 부호 없는 정수인 uint32 유형으로 표시됩니다. 변환 동작을 보여주는 코드에서 이러한 값은 다음 비트로 코딩됩니다. 알파는 31~24비트, 빨간색은 23~16비트, 녹색은 15~8비트, 파란색은 7~0비트. 그러나 형식 구현은 내부적으로 다른 표현을 자유롭게 사용할 수 있습니다.

넓게 보면 WebP 무손실 이미지에는 헤더 데이터, 변환 정보 및 실제 이미지 데이터입니다. 헤더는 이미지의 너비와 높이를 포함합니다. WebP 무손실 이미지는 4개의 다른 유형의 변환을 거쳐 인코딩됩니다. 비트스트림의 변환 정보에는 필요한 역변환을 적용해야 합니다.

2 명명법

ARGB: 알파, 빨간색, 녹색, 파란색 값으로 구성된 픽셀 값입니다.
ARGB 이미지: ARGB 픽셀이 포함된 2차원 배열입니다.
색상 캐시: 최근에 사용된 색상을 저장하여 더 짧은 코드로 이를 호출할 수 있는 작은 해시 주소 배열입니다.
색상 색인 생성 이미지: 소수 정수(WebP 무손실 내에서 최대 256)를 사용하여 색상에 색인을 생성할 수 있는 1차원 색상 이미지입니다.
색상 변환 이미지: 색상 구성요소의 상관관계에 관한 데이터가 포함된 2차원 하위 해상도 이미지입니다.
거리 매핑: 픽셀 값이 가장 작도록 LZ77 거리를 변경합니다. 2차원 근접도에 도움이 됩니다
엔트로피 이미지: 이미지의 각 정사각형에 어떤 엔트로피 인코딩을 사용해야 하는지 나타내는 2차원 하위 해상도 이미지입니다. 즉, 각 픽셀은 메타 접두사 코드입니다.
LZ77: 기호를 내보내거나 과거 기호의 시퀀스로 설명하는 사전 기반 슬라이딩 창 압축 알고리즘입니다.
메타 접두사 코드: 메타 접두사 테이블에서 요소의 색인을 생성하는 소수 정수(최대 16비트)입니다.
예측자 이미지: 이미지의 특정 정사각형에 어떤 공간 예측기가 사용되는지 나타내는 2차원 하위 해상도 이미지입니다.
프리픽스 코드: 더 적은 수의 비트가 사용되는 엔트로피 코딩을 수행하는 일반적인 방법 더 자주 사용하는 코드를 확인하세요.
접두어 코딩: 더 큰 정수를 엔트로피 코딩하는 방법으로, 엔트로피 코드를 사용하여 정수의 몇 비트를 코딩하고 나머지 비트를 원시로 코딩합니다. 이렇게 하면 기호 범위가 넓은 경우에도 엔트로피 코드의 설명이 비교적 작게 유지됩니다.
스캔줄 순서: 픽셀의 처리 순서 (왼쪽에서 오른쪽 및 상단에서 하단)로 드래그 앤 드롭합니다. 행이 완료되면 다음 행의 왼쪽 열에 표시됩니다.

3 RIFF 헤더

헤더의 시작 부분에는 RIFF 컨테이너가 있습니다. 다음 21바이트로 구성됩니다.

문자열 'RIFF'
청크 길이의 32비트 리틀 엔디언 값으로, 전체 크기입니다. 30비트 필드입니다. 일반적으로 이 값은 페이로드 크기 (파일 크기 - 8바이트: 'RIFF'의 경우 4바이트 4바이트)을 제공합니다.
문자열 'WEBP' (RIFF 컨테이너 이름)
문자열 'VP8L' (무손실 인코딩된 이미지 데이터의 경우 FourCC).
무손실 스트림의 바이트 수를 나타내는 little-endian 32비트 값입니다.
1바이트 서명 0x2f

비트스트림의 처음 28비트는 이미지의 너비와 높이를 지정합니다. 너비와 높이는 다음과 같이 14비트 정수로 디코딩됩니다.

int image_width = ReadBits(14) + 1;
int image_height = ReadBits(14) + 1;

이미지 너비와 높이의 14비트 정밀도로 인해 WebP 무손실 이미지의 최대 크기는 16,384x16,384픽셀로 제한됩니다.

alpha_is_used 비트는 힌트일 뿐이며 디코딩에 영향을 미치지 않아야 합니다. 또한 0으로 설정해야 합니다.

int alpha_is_used = ReadBits(1);

version_number는 0으로 설정해야 하는 3비트 코드입니다. 다른 값은 오류로 처리해야 합니다.

int version_number = ReadBits(3);

변환 4개

변환은 이미지 데이터를 가역적으로 조작하여 텍스트 데이터에서 인트로피를 생성합니다. 최종 압축을 더 촘촘하게 만들 수 있습니다.

이미지는 네 가지 유형의 변환을 거칠 수 있습니다. 1 비트는 변환의 존재를 나타냅니다 각 변환은 한 번만 사용할 수 있습니다. 이 변환은 기본 수준 ARGB 이미지에만 사용됩니다. 서브해상도 이미지를 (색상 변환 이미지, 엔트로피 이미지, 예측자 이미지)에는 변환이 없습니다. 변환의 끝을 나타내는 0 비트도 아닙니다.

일반적으로 인코더는 이러한 변환을 사용하여 잔여 이미지의 섀넌 엔트로피를 줄입니다. 또한 변환 데이터는 엔트로피 최소화를 기반으로 결정될 수 있습니다.

while (ReadBits(1)) {  // Transform present.
  // Decode transform type.
  enum TransformType transform_type = ReadBits(2);
  // Decode transform data.
  ...
}

// Decode actual image data (Section 5).

변환이 있는 경우 다음 두 비트는 변환 유형을 지정합니다. 변환에는 네 가지 유형이 있습니다.

enum TransformType {
  PREDICTOR_TRANSFORM             = 0,
  COLOR_TRANSFORM                 = 1,
  SUBTRACT_GREEN_TRANSFORM        = 2,
  COLOR_INDEXING_TRANSFORM        = 3,
};

변환 유형 다음에 변환 데이터가 나옵니다. 데이터 변환에 포함 역변환을 적용하는 데 필요한 정보와 변환 유형입니다. 역 변환은 비트 스트림에서 읽은 순서와 반대로 적용됩니다. 즉, 마지막 변환이 먼저 적용됩니다.

다음으로 다양한 유형의 변환 데이터를 설명합니다.

4.1 예측자 변환

예측자 변환은 인접한 픽셀이 종종 상관관계가 있다는 사실을 활용하여 엔트로피를 줄이는 데 사용할 수 있습니다. 예측자 변환에서 현재 픽셀 값은 이미 디코딩된 픽셀(스캔 선 순서)에서 예측되며 잔여 값(실제 - 예측)만 인코딩됩니다. 그린 구성요소는 픽셀 내에서 14개의 예측자 중 어떤 것이 ARGB 이미지의 특정 블록을 나타냅니다. 예측 모드는 사용할 예측 유형을 결정합니다. 이미지를 정사각형으로 나누고 정사각형의 모든 픽셀은 동일한 예측 모드를 사용합니다.

예측 데이터의 처음 3비트는 블록 너비와 높이를 숫자로 정의 비트의 수를 설정합니다.

int size_bits = ReadBits(3) + 2;
int block_width = (1 << size_bits);
int block_height = (1 << size_bits);
#define DIV_ROUND_UP(num, den) (((num) + (den) - 1) / (den))
int transform_width = DIV_ROUND_UP(image_width, 1 << size_bits);

변환 데이터에는 이미지의 각 블록에 대한 예측 모드가 포함됩니다. 그것은 은 픽셀의 녹색 구성요소가 픽셀의 14개의 예측자가 내부의 모든 block_width * block_height 픽셀에 사용됩니다. ARGB 이미지의 특정 블록을 나타냅니다. 이 하위 해상도 이미지는 5장에 설명된 것과 동일한 기법을 사용하여 인코딩됩니다.

블록 열의 수 transform_width는 2차원으로 사용됩니다. 있습니다. 픽셀 (x, y)의 경우 각 필터 블록을 계산할 수 있습니다. 주소 추가:

int block_index = (y >> size_bits) * transform_width +
                  (x >> size_bits);

예측 모드에는 14가지가 있습니다. 각 예측 모드에서 현재 픽셀 값은 값이 다음과 같은 하나 이상의 인접 픽셀에서 예측됩니다. 있습니다.

다음과 같이 현재 픽셀(P)의 인접 픽셀(TL, T, TR, L)을 선택했습니다.

O    O    O    O    O    O    O    O    O    O    O
O    O    O    O    O    O    O    O    O    O    O
O    O    O    O    TL   T    TR   O    O    O    O
O    O    O    O    L    P    X    X    X    X    X
X    X    X    X    X    X    X    X    X    X    X
X    X    X    X    X    X    X    X    X    X    X

여기서 TL은 왼쪽 상단, T는 상단, TR은 오른쪽 상단, L은 왼쪽 상단을 의미합니다. P 값을 예측할 때 모든 O, TL, T, TR, L 픽셀은 이미 처리되었으며 P 픽셀과 모든 X 픽셀은 알 수 없습니다.

위의 인접한 픽셀을 고려할 때 다양한 예측 모드는 다음과 같이 정의됩니다.

모드	현재 픽셀의 각 채널의 예측 값
0	0xff000000 (ARGB의 검은색 단색을 나타냄)
1	L
2	T
3	튀르키예
4	TL : 팀 리더
5	평균2(평균2(L, TR), T)
6	Average2(L, TL)
7	Average2(L, T)
8	Average2(TL, T)
9	Average2(T, TR)
10	평균2(평균2(L, TL), 평균2(T, TR))
11	선택(L, T, TL)
12	ClampAddSubtractFull(L, T, TL)
13	ClampAddSubtractHalf(Average2(L, T), TL)

Average2는 각 ARGB 구성요소에 대해 다음과 같이 정의됩니다.

uint8 Average2(uint8 a, uint8 b) {
  return (a + b) / 2;
}

선택 예측자는 다음과 같이 정의됩니다.

uint32 Select(uint32 L, uint32 T, uint32 TL) {
  // L = left pixel, T = top pixel, TL = top-left pixel.

  // ARGB component estimates for prediction.
  int pAlpha = ALPHA(L) + ALPHA(T) - ALPHA(TL);
  int pRed = RED(L) + RED(T) - RED(TL);
  int pGreen = GREEN(L) + GREEN(T) - GREEN(TL);
  int pBlue = BLUE(L) + BLUE(T) - BLUE(TL);

  // Manhattan distances to estimates for left and top pixels.
  int pL = abs(pAlpha - ALPHA(L)) + abs(pRed - RED(L)) +
           abs(pGreen - GREEN(L)) + abs(pBlue - BLUE(L));
  int pT = abs(pAlpha - ALPHA(T)) + abs(pRed - RED(T)) +
           abs(pGreen - GREEN(T)) + abs(pBlue - BLUE(T));

  // Return either left or top, the one closer to the prediction.
  if (pL < pT) {
    return L;
  } else {
    return T;
  }
}

ClampAddSubtractFull 및 ClampAddSubtractHalf 함수가 실행됩니다. 각 ARGB 구성요소에 대해 다음과 같이 안내합니다.

// Clamp the input value between 0 and 255.
int Clamp(int a) {
  return (a < 0) ? 0 : (a > 255) ? 255 : a;
}

int ClampAddSubtractFull(int a, int b, int c) {
  return Clamp(a + b - c);
}

int ClampAddSubtractHalf(int a, int b) {
  return Clamp(a + (a - b) / 2);
}

일부 테두리 픽셀에는 특수 처리 규칙이 있습니다. 예측 변환이 있는 경우 이러한 픽셀의 모드[0..13]와 관계없이 이미지의 맨 왼쪽 상단 픽셀의 예측 값은 0xff000000이고, 맨 윗줄의 모든 픽셀은 L-픽셀이며, 맨 왼쪽 열의 모든 픽셀은 T-픽셀입니다.

가장 오른쪽 열에 있는 픽셀의 TR 픽셀을 처리하는 것은 탁월합니다. 가장 오른쪽 열의 픽셀은 테두리에 없는 픽셀과 마찬가지로 모드 [0..13]을 사용하여 예측되지만, 현재 픽셀과 동일한 행의 맨 왼쪽 픽셀이 대신 TR 픽셀로 사용됩니다.

최종 픽셀 값은 예측 값의 각 채널을 인코딩된 잔여 값에 더하여 얻습니다.

void PredictorTransformOutput(uint32 residual, uint32 pred,
                              uint8* alpha, uint8* red,
                              uint8* green, uint8* blue) {
  *alpha = ALPHA(residual) + ALPHA(pred);
  *red = RED(residual) + RED(pred);
  *green = GREEN(residual) + GREEN(pred);
  *blue = BLUE(residual) + BLUE(pred);
}

4.2 색상 변환

색상 변환의 목표는 각 색상의 R, G, B 값을 데코레이션하는 것입니다. Pixel 색상 변환은 녹색(G) 값을 그대로 유지하고 녹색 값을 기반으로 빨간색(R) 값을 변환한 다음 녹색 값과 빨간색 값을 기반으로 파란색(B) 값을 변환합니다.

예측자 변환의 경우와 마찬가지로 먼저 이미지를 블록의 모든 픽셀에 동일한 변환 모드가 사용됩니다. 각 블록에는 세 가지 유형의 색상 변환 요소가 있습니다.

typedef struct {
  uint8 green_to_red;
  uint8 green_to_blue;
  uint8 red_to_blue;
} ColorTransformElement;

실제 색상 변환은 색상 변환 델타를 정의하여 수행됩니다. 색상 변환 델타는 특정 블록의 모든 픽셀에 대해 동일한 ColorTransformElement에 종속됩니다. 델타는 색 변환입니다. 그러면 역 색상 변환은 이러한 델타를 추가하는 것뿐입니다.

색상 변환 함수는 다음과 같이 정의됩니다.

void ColorTransform(uint8 red, uint8 blue, uint8 green,
                    ColorTransformElement *trans,
                    uint8 *new_red, uint8 *new_blue) {
  // Transformed values of red and blue components
  int tmp_red = red;
  int tmp_blue = blue;

  // Applying the transform is just subtracting the transform deltas
  tmp_red  -= ColorTransformDelta(trans->green_to_red,  green);
  tmp_blue -= ColorTransformDelta(trans->green_to_blue, green);
  tmp_blue -= ColorTransformDelta(trans->red_to_blue, red);

  *new_red = tmp_red & 0xff;
  *new_blue = tmp_blue & 0xff;
}

ColorTransformDelta는 3.5 고정 소수점 숫자 및 부호 있는 8비트 RGB 색상 채널 (c) [-128..127] 다음과 같이 정의됩니다.

int8 ColorTransformDelta(int8 t, int8 c) {
  return (t * c) >> 5;
}

ColorTransformDelta()를 호출하기 전에 8비트 부호 없는 표현(uint8)을 8비트 부호 있는 표현(int8)으로 변환해야 합니다. 부호가 있는 값은 8비트 2의 보수 숫자로 해석되어야 합니다(즉, uint8 범위 [128..255]는 변환된 int8 값의 [-128..-1] 범위에 매핑됨).

곱셈은 더 높은 정밀도(최소 16비트 정밀도)를 사용하여 실행해야 합니다. Shift 연산의 부호 확장 속성이 중요하지 않습니다. 여기에서 결과에서 최하위 8비트만 사용되며, 이 비트에서는 부호 확장 이동과 부호 없는 이동은 서로 일치합니다.

이제 디코딩이 역 색상 변환을 적용하고 원래 빨간색 및 파란색 값을 복구할 수 있도록 색상 변환 데이터의 콘텐츠를 설명합니다. 이 색 변환 데이터의 처음 3비트는 비트 수로 표현됩니다. 이는 예측자 변환과 같습니다.

int size_bits = ReadBits(3) + 2;
int block_width = 1 << size_bits;
int block_height = 1 << size_bits;

색상 변환 데이터의 나머지 부분에는 이미지의 각 블록에 해당하는 ColorTransformElement 인스턴스가 포함됩니다. 각 ColorTransformElement 'cte'는 하위 해상도 이미지에서 픽셀로 처리됩니다. 알파 구성요소가 255, 빨간색 구성요소는 cte.red_to_blue, 초록색 구성요소는 cte.green_to_blue이고 파란색 구성요소는 cte.green_to_red입니다.

디코딩 중에 블록의 인스턴스 ColorTransformElement개가 디코딩되고 픽셀의 ARGB 값에 역색 변환이 적용됩니다. 따라서 반전 색상 변환은 ColorTransformElement 값을 빨간색 및 파란색 채널로 변환합니다. 알파 및 녹색 그대로 유지됩니다

void InverseTransform(uint8 red, uint8 green, uint8 blue,
                      ColorTransformElement *trans,
                      uint8 *new_red, uint8 *new_blue) {
  // Transformed values of red and blue components
  int tmp_red = red;
  int tmp_blue = blue;

  // Applying the inverse transform is just adding the
  // color transform deltas
  tmp_red  += ColorTransformDelta(trans->green_to_red, green);
  tmp_blue += ColorTransformDelta(trans->green_to_blue, green);
  tmp_blue +=
      ColorTransformDelta(trans->red_to_blue, tmp_red & 0xff);

  *new_red = tmp_red & 0xff;
  *new_blue = tmp_blue & 0xff;
}

4.3 녹색 변환 빼기

녹색 뺄셈 변환은 표시됩니다. 이 변환이 있으면 디코더는 값을 빨간색과 파란색 값으로 변경합니다. 이 변환과 연결된 데이터가 없습니다. 디코더는 다음과 같이 역변환을 적용합니다.

void AddGreenToBlueAndRed(uint8 green, uint8 *red, uint8 *blue) {
  *red  = (*red  + green) & 0xff;
  *blue = (*blue + green) & 0xff;
}

이 변환은 색상 변환을 사용하여 모델링할 수 있으므로 중복되지만 여기에는 추가 데이터가 없으므로 녹색 빼기 변환은 본격적인 색상 변환보다 적은 비트를 사용하여 코딩할 수 있습니다.

4.4 색상 색인 변환

고유한 픽셀 값이 많지 않은 경우 색상 색인 배열을 만들고 픽셀 값을 배열의 색인으로 대체하는 것이 더 효율적일 수 있습니다. 색상 이를 수행합니다 WebP 무손실 맥락에서는 WebP 무손실 인코딩에 유사하지만 더 동적인 개념인 색상 캐시가 있으므로 이를 팔레트 변환이라고 부르지 않습니다.

색상 색인 생성 변환은 이미지의 고유한 ARGB 값 수를 확인합니다. 이 숫자가 임곗값(256) 미만이면 이러한 ARGB 값의 배열이 생성되고, 이 배열은 픽셀 값을 해당 색상 지수로 대체하는 데 사용됩니다. 픽셀의 녹색 채널이 색상 지수로 대체되고 모든 알파 값은 255로 설정되며 모든 빨간색 및 파란색 값은 0으로 설정됩니다.

변환 데이터에는 색상 표 크기와 색상의 항목이 포함됩니다. 표에서 확인할 수 있습니다. 디코더는 다음과 같이 색상 색인 생성 변환 데이터를 읽습니다.

// 8-bit value for the color table size
int color_table_size = ReadBits(8) + 1;

색상 표는 이미지 저장소 형식 자체를 사용하여 저장됩니다. 색상 표는 RIFF 헤더, 이미지 크기, 변환 없이 이미지를 읽어서 얻을 수 있으며, 높이는 1픽셀, 너비는 color_table_size라고 가정합니다. 색상 표는 이미지 엔트로피를 줄이기 위해 항상 뺄셈으로 코딩됩니다. 팔레트 색상의 델타는 일반적으로 색상 자체보다 엔트로피가 훨씬 적으므로 작은 이미지의 경우 상당한 절감 효과가 있습니다. 디코딩 시 색상 표의 모든 최종 색상은 이전 셀에 각 ARGB 구성요소의 색상 구성요소 값을 개별적으로 저장하고 결과의 중요 8 비트.

이미지의 역변환은 색상 표의 색인인 픽셀 값을 실제 색상 표 값으로 대체하는 것입니다. 색인은 ARGB 색상의 녹색 구성요소를 기반으로 생성됩니다.

// Inverse transform
argb = color_table[GREEN(argb)];

색인이 color_table_size보다 크거나 같은 경우 argb 색상 값은 0x00000000(투명한 검은색)으로 설정해야 합니다.

색상 표가 작은 경우 (16 색상 이하) 여러 픽셀 단일 픽셀로 번들화됩니다. 픽셀 번들링은 여러 개의 픽셀(2, 4 또는 8)을 단일 픽셀로 묶어 이미지 너비를 각각 줄입니다. 픽셀 번들링을 통해 임베딩 레이어의 보다 효율적인 65픽셀을 사용하고, 산술 코딩과 같은 고유값이 16개 이하인 경우에만 사용할 수 있습니다.

color_table_size는 결합되는 픽셀 수를 지정합니다.

int width_bits;
if (color_table_size <= 2) {
  width_bits = 3;
} else if (color_table_size <= 4) {
  width_bits = 2;
} else if (color_table_size <= 16) {
  width_bits = 1;
} else {
  width_bits = 0;
}

width_bits의 값은 0, 1, 2, 3입니다. 값 0은 픽셀이 없음을 나타냅니다. 이미지에 대해 번들링이 수행되어야 합니다. 값이 1이면 두 픽셀이 결합되었음을 나타내며 각 픽셀의 범위는 [0..15]입니다. 값 2는 4개의 픽셀이 결합되었음을 나타내며 각 픽셀의 범위는 [0..3]입니다. 값 3 는 8개의 픽셀이 결합되어 있고 각 픽셀의 범위가 [0..1]임을 나타냅니다. 바이너리 값을 의미합니다

값은 다음과 같이 녹색 구성요소에 패킹됩니다.

width_bits = 1: x ≡ 0(mod 2)인 모든 x 값의 경우 x의 녹색 값이 x/2의 녹색 값의 최솟값 4비트에 배치되고 x + 1의 녹색 값이 x/2의 녹색 값의 최댓값 4비트에 배치됩니다.
width_bits = 2: 모든 x 값에 대해 x 게재됩니다. 0 (mod 4)인 경우 녹색 x의 값은 x + 1 ~ x + 3의 녹색 값은 x / 4에서 녹색 값의 더 중요한 비트로 올립니다.
width_bits = 3: 모든 x 값에 대해 x 게재됩니다. 0 (mod 8)인 경우 녹색 x의 값은 녹색의 최하위 비트에 배치됩니다. x + 1 ~ x + 7의 녹색 값은 순서대로 배치됩니다. x / 8에서 녹색 값의 더 중요한 비트로 전달됩니다.

이 변환을 읽은 후 image_width는 width_bits에 의해 서브 샘플링됩니다. 이는 후속 변환의 크기에 영향을 미칩니다. 새 크기는 앞서 정의된 DIV_ROUND_UP를 사용하여 계산할 수 있습니다.

image_width = DIV_ROUND_UP(image_width, 1 << width_bits);

5 이미지 데이터

이미지 데이터는 스캔 선 순서로 된 픽셀 값 배열입니다.

5.1 이미지 데이터의 역할

이미지 데이터는 다음과 같은 5가지 역할로 사용됩니다.

ARGB 이미지: 이미지의 실제 픽셀을 저장합니다.
엔트로피 이미지: 메타 접두사 코드를 저장합니다('메타 접두사 코드 디코딩' 참고).
예측자 이미지: 예측자 변환의 메타데이터를 저장합니다 (자세한 내용은 "예측자 변환")을 포함해야 합니다.
색상 변환 이미지: 이미지의 여러 블록에 대해 ColorTransformElement 값('색상 변환'에 정의됨)으로 생성됩니다.
색상 색인 생성 이미지: color_table_size 크기의 배열 (최대 256) ARGB 값). "Color Indexing 변환").

5.2 이미지 데이터 인코딩

이미지 데이터의 인코딩은 역할과 무관합니다.

이미지는 먼저 고정 크기 블록 집합 (일반적으로 16x16픽셀)으로 나뉩니다. 블록)을 사용합니다. 이러한 각 블록은 자체 엔트로피 코드를 사용하여 모델링됩니다. 또한 여러 블록이 동일한 엔트로피 코드를 공유할 수 있습니다.

근거: 엔트로피 코드를 저장하면 비용이 발생합니다. 이러한 비용은 통계적으로 유사한 블록이 엔트로피 코드를 공유하는 경우 해당 코드를 한 번만 사용할 수 있습니다. 예를 들어 인코더는 통계적 속성을 사용하여 블록을 클러스터링하거나 무작위로 선택된 클러스터 쌍을 반복적으로 결합하여 유사한 블록을 찾을 수 있습니다. 이 경우 이미지를 인코딩하는 데 필요한 전체 비트 수가 줄어듭니다.

각 픽셀은 다음 세 가지 메서드 중 하나를 사용하여 인코딩됩니다.

접두사로 코딩된 리터럴: 각 채널 (녹색, 빨간색, 파란색, 알파)은 독립적으로 코딩됩니다.
LZ77 역참조: 일련의 픽셀이 참조의 다른 곳에서 복사됨 이미지
색상 캐시 코드: 짧은 곱셈 해시 코드 (색상 캐시)를 사용하여 인덱스)를 나타냅니다.

다음 하위 섹션에서는 각각에 대해 자세히 설명합니다.

5.2.1 프리픽스로 코딩된 리터럴

픽셀은 녹색, 빨간색, 파란색 및 알파라는 접두사 코딩된 값( 해당 주문)을 클릭합니다. 자세한 내용은 섹션 6.2.3을 참고하세요. 확인하세요.

5.2.2 LZ77 역참조

역방향 참조는 길이 및 거리 코드의 튜플입니다.

길이는 스캔 행 순서에서 복사할 픽셀 수를 나타냅니다.
거리 코드는 이전에 본 차량의 위치를 나타내는 숫자입니다. 복사됩니다. 정확한 매핑은 아래에 설명되어 있습니다.

길이 및 거리 값은 LZ77 접두사 코딩을 사용하여 저장됩니다.

LZ77 접두사 코딩은 큰 정수 값을 접두사 코드와 추가 비트의 두 부분으로 나눕니다. 접두어 코드는 엔트로피 코드를 사용하여 저장되며 추가 비트는 엔트로피 코드 없이 그대로 저장됩니다.

근거: 이 접근 방식은 엔트로피 코드의 저장소 요구사항을 줄입니다. 또한 큰 값은 일반적으로 드물기 때문에 추가 비트는 값이 거의 없습니다. 따라서 이 접근 방식은 전반적으로 더 나은 압축을 제공합니다.

다음 표에는 다양한 값 범위를 저장하는 데 사용되는 접두사 코드와 추가 비트가 표시됩니다.

값 범위	프리픽스 코드	추가 비트
1	0	0
2	1	0
3	2개	0
4	3	0
5..6	4	1
7~8	5	1
9..12	6	2
13..16	7	2
...	...	...
3072..4096	23	10
...	...	...
524289..786432	38	18
786433..1048576	39	18

접두사 코드에서 (길이 또는 거리) 값을 가져오는 의사코드는 다음과 같습니다.

if (prefix_code < 4) {
  return prefix_code + 1;
}
int extra_bits = (prefix_code - 2) >> 1;
int offset = (2 + (prefix_code & 1)) << extra_bits;
return offset + ReadBits(extra_bits) + 1;

거리 매핑

앞서 언급한 대로 거리 코드는 이전에 본 픽셀의 위치를 나타내는 숫자로, 이 픽셀에서 픽셀을 복사합니다. 이 하위 섹션에서는 거리 코드와 이전 픽셀의 위치 간의 매핑을 정의합니다.

120보다 큰 거리 코드는 스캔 선 순서의 픽셀 거리를 나타내며 120으로 오프셋됩니다.

최소 거리 코드 [1..120] 은 특수 코드이며 될 수 있습니다. 이 이웃은 120픽셀로 구성됩니다.

현재 픽셀보다 1~7행 위에 있고 최대 8열인 픽셀 왼쪽으로 또는 현재 픽셀에서 오른쪽으로 최대 7개 열까지 지정할 수 있습니다. [총계 이러한 픽셀 = 7 * (8 + 1 + 7) = 112]이어야 합니다.
현재 픽셀과 같은 행에 있고 최대 8픽셀인 픽셀 열을 현재 픽셀의 왼쪽에 표시합니다. [이러한 픽셀 8개]

거리 코드 distance_code과 인접 픽셀 간의 매핑 오프셋 (xi, yi)는 다음과 같습니다.

(0, 1),  (1, 0),  (1, 1),  (-1, 1), (0, 2),  (2, 0),  (1, 2),
(-1, 2), (2, 1),  (-2, 1), (2, 2),  (-2, 2), (0, 3),  (3, 0),
(1, 3),  (-1, 3), (3, 1),  (-3, 1), (2, 3),  (-2, 3), (3, 2),
(-3, 2), (0, 4),  (4, 0),  (1, 4),  (-1, 4), (4, 1),  (-4, 1),
(3, 3),  (-3, 3), (2, 4),  (-2, 4), (4, 2),  (-4, 2), (0, 5),
(3, 4),  (-3, 4), (4, 3),  (-4, 3), (5, 0),  (1, 5),  (-1, 5),
(5, 1),  (-5, 1), (2, 5),  (-2, 5), (5, 2),  (-5, 2), (4, 4),
(-4, 4), (3, 5),  (-3, 5), (5, 3),  (-5, 3), (0, 6),  (6, 0),
(1, 6),  (-1, 6), (6, 1),  (-6, 1), (2, 6),  (-2, 6), (6, 2),
(-6, 2), (4, 5),  (-4, 5), (5, 4),  (-5, 4), (3, 6),  (-3, 6),
(6, 3),  (-6, 3), (0, 7),  (7, 0),  (1, 7),  (-1, 7), (5, 5),
(-5, 5), (7, 1),  (-7, 1), (4, 6),  (-4, 6), (6, 4),  (-6, 4),
(2, 7),  (-2, 7), (7, 2),  (-7, 2), (3, 7),  (-3, 7), (7, 3),
(-7, 3), (5, 6),  (-5, 6), (6, 5),  (-6, 5), (8, 0),  (4, 7),
(-4, 7), (7, 4),  (-7, 4), (8, 1),  (8, 2),  (6, 6),  (-6, 6),
(8, 3),  (5, 7),  (-5, 7), (7, 5),  (-7, 5), (8, 4),  (6, 7),
(-6, 7), (7, 6),  (-7, 6), (8, 5),  (7, 7),  (-7, 7), (8, 6),
(8, 7)

예를 들어 거리 코드 1는 인접한 픽셀(즉, 현재 픽셀 위의 픽셀)의 오프셋 (0, 1)을 나타냅니다(X 방향의 픽셀 차이는 0이고 Y 방향의 픽셀 차이는 1). 마찬가지로 거리 코드 3는 왼쪽 상단 픽셀을 나타냅니다.

디코더는 다음과 같이 거리 코드 distance_code를 스캔 선 순서 거리 dist로 변환할 수 있습니다.

(xi, yi) = distance_map[distance_code - 1]
dist = xi + yi * image_width
if (dist < 1) {
  dist = 1
}

여기서 distance_map는 위에 언급된 매핑이고 image_width는 너비입니다. 볼 수 있습니다

5.2.3 색상 캐시 코딩

색상 캐시에는 이미지에 최근에 사용된 색상 집합이 저장됩니다.

사유: 이런 식으로 최근에 사용한 색상을 가끔 언급할 수 있습니다. 출력하는 것보다 더 효율적으로 데이터를 내보낼 수 있습니다 (자세한 내용은 참조 문서 5.2.1 및 5.2.2)

색상 캐시 코드는 다음과 같이 저장됩니다. 먼저 색상 캐시가 사용되는지 나타내는 1비트 값이 있습니다. 이 비트가 0이면 색상 캐시 코드가 없습니다. 존재하며 녹색 레코더를 디코딩하는 접두어 코드로는 기호 및 길이 접두사 코드. 그러나 이 비트가 1이면 색상 캐시는 다음 읽기 크기:

int color_cache_code_bits = ReadBits(4);
int color_cache_size = 1 << color_cache_code_bits;

color_cache_code_bits는 색상 캐시 (1 << color_cache_code_bits)의 크기를 정의합니다. 허용되는 값의 범위 color_cache_code_bits는 [1..11]입니다. 호환되는 디코더는 다른 값의 비트스트림이 손상되었기 때문입니다.

색상 캐시는 크기가 color_cache_size인 배열입니다. 항목당 ARGB 1개 저장 color[색상] 색상은 (0x1e35a7bd * color) >> (32 - color_cache_code_bits)로 색인을 생성하여 조회됩니다. 색상 캐시에서는 한 번만 조회가 실행되며 충돌 해결은 없습니다.

이미지 디코딩 또는 인코딩이 시작되면 모든 색상 캐시 값의 모든 항목이 0으로 설정됩니다. 색상 캐시 코드는 디코딩 시간을 단축할 수 있습니다. 색상 캐시의 상태는 역참조 또는 리터럴로 생성된 모든 픽셀을 스트림에 표시되는 순서대로 캐시에 삽입하여 유지됩니다.

6 엔트로피 코드

6.1 개요

대부분의 데이터는 표준 접두사 코드를 사용하여 코딩됩니다. 따라서 실제 접두사 코드가 아닌 접두사 코드 길이를 전송하여 코드가 전송됩니다.

특히 이 형식은 공간적으로 가변적인 접두사 코딩을 사용합니다. 기타 이미지의 다른 블록이 잠재적으로 다른 엔트로피를 사용할 수 있고 있습니다.

근거: 이미지의 영역마다 특성이 다를 수 있습니다. 따라서 다양한 엔트로피 코드를 사용할 수 있도록 허용하면 더 많은 유연성과 잠재적으로 더 나은 압축을 제공할 수 있습니다.

6.2 세부정보

인코딩된 이미지 데이터는 여러 부분으로 구성됩니다.

접두어 코드 디코딩 및 빌드
메타 접두사 코드
엔트로피로 코딩된 이미지 데이터입니다.

주어진 픽셀 (x, y)에 대해 있습니다. 다음 코드는 다음과 같습니다 (비트스트림 순서).

프리픽스 코드 #1: 녹색 채널, 역참조 길이 및 색상 캐시
접두사 코드 2, 3, 4: 각각 빨간색, 파란색, 알파 채널에 사용됩니다.
프리픽스 코드 #5: 역참조 거리에 사용됩니다.

여기서부터 이 집합을 접두사 코드 그룹이라고 합니다.

6.2.1 접두사 코드 디코딩 및 빌드

이 섹션에서는 비트스트림에서 접두사 코드 길이를 읽는 방법을 설명합니다.

접두사 코드 길이는 두 가지 방법으로 코딩할 수 있습니다. 사용되는 메서드는 1비트 값으로 지정됩니다.

이 비트가 1이면 간단한 코드 길이 코드입니다.
이 비트가 0이면 일반 코드 길이 코드입니다.

두 경우 모두 스트림의 일부인 사용되지 않은 코드 길이가 있을 수 있습니다. 이는 비효율적일 수 있지만 형식에서 허용됩니다. 설명된 트리는 완전한 바이너리 트리여야 합니다. 단일 리프 노드는 완전한 바이너리 트리로 간주되며 코드 길이 코드 또는 일반 코드 길이 코드 중 하나입니다. 일반 코드 길이 코드를 사용하여 단일 리프 노드를 코딩할 때는 하나를 제외한 모든 코드 길이가 0이고 단일 리프 노드 값은 길이가 1로 표시됩니다. 단일 리프 노드 트리가 사용될 때 비트가 소비되지 않는 경우에도 마찬가지입니다.

간단한 코드 길이 코드

이 변형은 접두사 기호가 1개 또는 2개만 있는 특수한 경우에 사용됩니다. [0..255] 범위(코드 길이 1) 다른 모든 접두사 코드 길이는 암시적으로 0입니다.

첫 번째 비트는 기호의 수를 나타냅니다.

int num_symbols = ReadBits(1) + 1;

다음은 기호 값입니다.

이 첫 번째 기호는 is_first_8bits 범위는 각각 [0..1] 또는 [0..255]입니다. 두 번째 기호(있는 경우)는 항상 [0..255] 범위 내에 있다고 가정되며 8비트로 코딩됩니다.

int is_first_8bits = ReadBits(1);
symbol0 = ReadBits(1 + 7 * is_first_8bits);
code_lengths[symbol0] = 1;
if (num_symbols == 2) {
  symbol1 = ReadBits(8);
  code_lengths[symbol1] = 1;
}

두 기호는 달라야 합니다. 기호 중복은 허용되지만 비효율적입니다.

참고: 또 다른 특수한 경우는 모든 접두사 코드 길이가 0(빈 접두사 코드)인 경우입니다. 예를 들어 거리의 접두어 코드는 다음과 같은 경우 비어 있을 수 있습니다. 역방향 참조가 없습니다 마찬가지로 알파, 빨간색 및 동일한 메타 접두사 코드 내에 있는 모든 픽셀이 생성된 경우 파란색이 비어 있을 수 있음 사용할 수 있습니다. 하지만 이 경우에는 특수한 처리가 필요하지 않습니다. 빈 접두사 코드는 단일 기호 0가 포함된 코드로 코딩할 수 있습니다.

일반 코드 길이 코드

접두사 코드의 코드 길이는 8비트이며 다음과 같이 읽힙니다. 첫째, num_code_lengths는 코드 길이의 수를 지정합니다.

int num_code_lengths = 4 + ReadBits(4);

코드 길이는 접두사 코드를 사용하여 인코딩됩니다. 먼저 하위 수준 코드 길이인 code_length_code_lengths를 읽어야 합니다. 나머지 code_length_code_lengths(kCodeLengthCodeOrder의 순서에 따라)는 0입니다.

int kCodeLengthCodes = 19;
int kCodeLengthCodeOrder[kCodeLengthCodes] = {
  17, 18, 0, 1, 2, 3, 4, 5, 16, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
};
int code_length_code_lengths[kCodeLengthCodes] = { 0 };  // All zeros
for (i = 0; i < num_code_lengths; ++i) {
  code_length_code_lengths[kCodeLengthCodeOrder[i]] = ReadBits(3);
}

다음으로, ReadBits(1) == 0인 경우 각 기호 유형(A, R, G, B, 거리)의 최대 상이한 읽기 기호 수(max_symbol)가 알파벳 크기로 설정됩니다.

G 채널: 256 + 24 + color_cache_size
기타 리터럴(A, R, B): 256
거리 코드: 40

그렇지 않으면 다음과 같이 정의됩니다.

int length_nbits = 2 + 2 * ReadBits(3);
int max_symbol = 2 + ReadBits(length_nbits);

max_symbol가 기호 유형의 알파벳 크기보다 크면 비트 스트림이 잘못된 것입니다.

그런 다음 접두사 테이블이 code_length_code_lengths에서 빌드되고 최대 max_symbol 코드 길이를 읽는 데 사용됩니다.

코드 [0..15]는 리터럴 코드 길이를 나타냅니다.
- 값 0은 코딩된 기호가 없음을 의미합니다.
- 값 [1..15] 는 각 코드의 비트 길이를 나타냅니다.
코드 16은 이전의 0이 아닌 값[3..6]을 3 + ReadBits(2)번 반복합니다. 코드 16이 0이 아닌 값 앞에 사용되는 경우 값을 방출하면 값 8이 반복됩니다.
코드 17은 연속된 0 길이 [3..10], 즉 3 + ReadBits(3) 회를 내보냅니다.
코드 18은 길이가 [11..138]인 연속된 0을 방출합니다. 즉, 11 + ReadBits(7)회.

코드 길이를 읽으면 각 기호 유형(A, R, G, B, 거리)의 접두사 코드가 각 알파벳 크기를 사용하여 형성됩니다.

정상 코드 길이 코드는 전체 결정 트리, 즉 0이 아닌 모든 코드의 2 ^ (-length)는 정확히 1이어야 합니다. 그러나 한 가지 예외는 단일 리프 노드 트리입니다. 여기서 리프 노드는 값이 1로 표시되어 있고 다른 값은 0으로 표시됩니다.

6.2.2 메타 접두사 코드 디코딩

앞서 언급했듯이 형식에서는 각 네임스페이스에 다른 접두어 코드를 사용할 수 있습니다. 이미지의 여러 블록을 메타 접두어 코드는 이미지의 여러 부분에 사용할 접두어 코드입니다.

메타 접두어 코드는 ARGB 이미지의 역할

1비트로 표시된 메타 접두사 코드에는 두 가지 가능성이 있습니다. 값:

이 비트가 0이면 이미지의 모든 위치에 하나의 메타 접두사 코드가 사용됩니다. 더 이상 데이터가 저장되지 않습니다.
이 비트가 1이면 이미지에서 여러 메타 접두사 코드를 사용합니다. 이러한 메타 접두사 코드는 엔트로피 이미지(아래 설명)로 저장됩니다.

픽셀의 빨간색과 녹색 구성 요소는 ARGB 이미지의 특정 블록을 나타냅니다.

엔트로피 이미지

엔트로피 이미지는 엔트로피 이미지의 서로 다른 부분에 사용되는 접두어 코드를 이미지

처음 3비트는 prefix_bits 값을 포함합니다. 엔트로피의 차원 이미지는 prefix_bits에서 파생됩니다.

int prefix_bits = ReadBits(3) + 2;
int prefix_image_width =
    DIV_ROUND_UP(image_width, 1 << prefix_bits);
int prefix_image_height =
    DIV_ROUND_UP(image_height, 1 << prefix_bits);

여기서 DIV_ROUND_UP은 앞에서 정의된 대로입니다.

다음 비트에는 너비가 prefix_image_width이고 높이가 prefix_image_height인 엔트로피 이미지가 포함됩니다.

메타 프리픽스 코드 해석

ARGB 이미지의 접두사 코드 그룹 수는 엔트로피 이미지에서 가장 큰 메타 접두사 코드를 찾으면 얻을 수 있습니다.

int num_prefix_groups = max(entropy image) + 1;

여기서 max(entropy image)는 학습합니다.

각 접두사 코드 그룹에는 접두사 코드 5개가 포함되므로 총 접두사 코드 수는 다음과 같습니다.

int num_prefix_codes = 5 * num_prefix_groups;

ARGB 이미지의 픽셀(x, y)를 고려하면 다음과 같이 사용할 상응하는 접두사 코드를 가져올 수 있습니다.

int position =
    (y >> prefix_bits) * prefix_image_width + (x >> prefix_bits);
int meta_prefix_code = (entropy_image[position] >> 8) & 0xffff;
PrefixCodeGroup prefix_group = prefix_code_groups[meta_prefix_code];

여기서는 PrefixCodeGroup 구조가 있다고 가정했습니다. 5개의 접두어 코드 집합을 나타냅니다. 또한 prefix_code_groups은(는) PrefixCodeGroup 배열(크기 num_prefix_groups)입니다.

그런 다음 디코더는 '엔트로피 코딩된 이미지 데이터 디코딩'에 설명된 대로 접두사 코드 그룹 prefix_group를 사용하여 픽셀(x, y)를 디코딩합니다.

6.2.3 엔트로피로 코딩된 이미지 데이터 디코딩

이미지의 현재 위치(x, y)에서 디코더는 먼저 이전 섹션에서 설명한 대로 해당하는 접두사 코드 그룹을 식별합니다. 접두사 코드 그룹이 주어지면 픽셀은 다음과 같이 읽고 디코딩됩니다.

다음으로, 접두사 코드 #1을 사용하여 비트스트림에서 기호 S를 읽습니다. S는 0~(256 + 24 + color_cache_size- 1) 범위의 정수입니다.

S의 해석은 그 값에 따라 다릅니다.

S가 256보다 작은 경우
1. 녹색 구성요소로 S를 사용합니다.
2. 접두사 코드 2를 사용하여 비트 스트림에서 빨간색을 읽습니다.
3. 접두사 코드 3을 사용하여 비트 스트림에서 파란색을 읽습니다.
4. 접두어 코드 #4를 사용하여 비트스트림에서 알파를 읽습니다.
S가 256 이상이고 일 < 256 + 24 <ph type="x-smartling-placeholder">
1. 길이 접두어 코드로 S - 256을 사용합니다.
2. 비트 스트림에서 길이에 관한 추가 비트를 읽습니다.
3. 길이 접두사 코드와 읽은 추가 비트에서 역참조 길이 L을 결정합니다.
4. 접두사 코드 5를 사용하여 비트스트림에서 거리 접두사 코드를 읽습니다.
5. 비트스트림으로부터의 거리에 대해 추가 비트를 읽습니다.
6. 거리 접두사 코드로부터 역참조 거리 D를 구합니다. 나머지 비트는 읽습니다.
7. 다음에서 시작하는 픽셀 시퀀스에서 L개의 픽셀을 스캔 라인 순서대로 복사합니다. D픽셀을 뺀 값으로 이스케이프합니다.
S가 256+24 이상인 경우 <ph type="x-smartling-placeholder">
1. S - (256 + 24)를 색상 캐시의 색인으로 사용합니다.
2. 해당 색인에서 색상 캐시에서 ARGB 색상을 가져옵니다.

7 형식의 전체 구조

다음은 ABNF (증강 배커스 나우르 형식) 형식을 보여줍니다. RFC 5234 RFC 7405 모든 세부정보를 다루지는 않습니다. 이미지 종료 (EOI) 픽셀 수 (image_width * image_height)로만 암시적으로 코딩됩니다.

*element는 element를 0회 이상 반복할 수 있음을 의미합니다. 5element는 element가 정확히 5번 반복된다는 의미입니다. %b는 바이너리 값을 나타냅니다.

7.1 기본 구조

format        = RIFF-header image-header image-stream
RIFF-header   = %s"RIFF" 4OCTET %s"WEBPVP8L" 4OCTET
image-header  = %x2F image-size alpha-is-used version
image-size    = 14BIT 14BIT ; width - 1, height - 1
alpha-is-used = 1BIT
version       = 3BIT ; 0
image-stream  = optional-transform spatially-coded-image

7.2 변환의 구조

optional-transform   =  (%b1 transform optional-transform) / %b0
transform            =  predictor-tx / color-tx / subtract-green-tx
transform            =/ color-indexing-tx

predictor-tx         =  %b00 predictor-image
predictor-image      =  3BIT ; sub-pixel code
                        entropy-coded-image

color-tx             =  %b01 color-image
color-image          =  3BIT ; sub-pixel code
                        entropy-coded-image

subtract-green-tx    =  %b10

color-indexing-tx    =  %b11 color-indexing-image
color-indexing-image =  8BIT ; color count
                        entropy-coded-image

7.3 이미지 데이터의 구조

spatially-coded-image =  color-cache-info meta-prefix data
entropy-coded-image   =  color-cache-info data

color-cache-info      =  %b0
color-cache-info      =/ (%b1 4BIT) ; 1 followed by color cache size

meta-prefix           =  %b0 / (%b1 entropy-image)

data                  =  prefix-codes lz77-coded-image
entropy-image         =  3BIT ; subsample value
                         entropy-coded-image

prefix-codes          =  prefix-code-group *prefix-codes
prefix-code-group     =
    5prefix-code ; See "Interpretation of Meta Prefix Codes" to
                 ; understand what each of these five prefix
                 ; codes are for.

prefix-code           =  simple-prefix-code / normal-prefix-code
simple-prefix-code    =  ; see "Simple Code Length Code" for details
normal-prefix-code    =  ; see "Normal Code Length Code" for details

lz77-coded-image      =
    *((argb-pixel / lz77-copy / color-cache-code) lz77-coded-image)

다음은 가능한 시퀀스의 예입니다.

RIFF-header image-size %b1 subtract-green-tx
%b1 predictor-tx %b0 color-cache-info
%b0 prefix-codes lz77-coded-image