【H.264/AVC视频编解码技术详解】十八：算术编码的基本原理与实现

程序员文章站 2022-07-14 22:16:36

...

《H.264/AVC视频编解码技术详解》****已经在“CSDN学院”上线，视频中详述了H.264的背景、标准协议和实现，并通过一个实战工程的形式对H.264的标准进行解析和实现，欢迎观看！

“纸上得来终觉浅，绝知此事要躬行”，只有自己按照标准文档以代码的形式操作一遍，才能对视频压缩编码标准的思想和方法有足够深刻的理解和体会！

链接地址：H.264/AVC视频编解码技术详解

GitHub代码地址：点击这里

一、H.264的算术编码

在前述的几章节的博文/视频中，我们已经了解到熵编码是利用信息的统计冗余进行数据压缩的无损编码方法，并且已经讨论过了熵编码的基本原理、H.264中使用的语法元素解析算法“指数哥伦布编码”的算法与实践：

并且在后续的内容中，讨论了在H.264中非常重要的一种熵编码方法，即上下文自适应的变长编码（CAVLC）：

以上的内容在H.264的baseline profile中具有广泛应用。然而在实际应用场景中更为流行的通常是main profile，在main profile中为了进一步提升压缩比率，采用的熵编码方法不是CAVLC，而是压缩效率更高的CABAC。

CABAC的全称为上下文自适应的二进制算术编码（Context-Adaptive Binary Arithmetic Coding, CABAC），是一种经过特殊设计的算术编码，其具体步骤主要有：

设定编码上下文；
语法元素的二值化；
算术编码；

二、算术编码的基本概念

算术编码属于熵编码的一种重要的类型，其作用同变长编码等熵编码方法类似，用于压缩输入数据中的统计冗余，并且使用算术编码的压缩同样是无损压缩。

在本系列第1篇中讨论了典型的变长编码方法——哈夫曼编码。包括哈夫曼编码在内的变长编码具有一个共同特点，就是针对每一个码元不同的概率，分配每个码元对应的码字。通常针对概率更高的码元，分配长度更短的码字；针对概率较低的码元，分配长度较长的码字。通过这种不同长度码字的分配使得整体输入信息的平均码字长度小于定长编码，达到数据压缩的效果。

另一方面，由于采用这种变长度的编码方法，变长编码存在一项难以突破的性能瓶颈：即使是某一个输入信源的概率再高，也至少需要1个bit的码字。这种特性限制了编码性能进一步向信源熵逼近，也导致了无法进一步提升整体的压缩性能。

算术编码的引入可以有效解决这个问题。算术编码的思想同变长编码完全不同，算术编码无法针对每一个输入码元准确细分出对应的码字。另外，变长编码可以针对短输入信息进行编码，而算术编码对类似一两个码元的输入信息通常没有任何意义，因为生成的码流长度通常更长。

在算术编码执行的过程中，始终需要两个区间来计算，这两个区间即信源的概率区间和码流的编码区间。