| 数字视频编解码技术的演变 |
| 国际标准通常是由国际标准化组织ISO在国际电信联盟 ITU的技术建议的基础上制订的。数字视频编解码标准也经历了多次变革,H264标准使运动图像压缩技术上升到了一个更高的阶段,在较低带宽上提供高质量的图像传输是H.264的应用亮点。H.264的推广应用对视频终端、网守、网关、MCU等系统的要求较高,将有力地推动视频会议软设备在各个方面的不断完善。 |
| H.264的核心竞争力 |
| H.264最具价值的部分无疑是更高的数据压缩比。压缩技术的基本原理就是将视频文件中的非重要信息过滤,以便让数据能够更快地在网络中传输。在同等的图像质量条件下,H.264的数据压缩比能比当前DVD系统中使用的MPEG-2高2-3倍,比MPEG-4高1.5-2倍。正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。 |
| 在MPEG-4需要2Mbps的传输速率匹配时,H.264只需要1/2Mbp的传输速率。我们用交通运输来做更加形象的比喻:同样是用一辆卡车运输一个大箱子,假如MPEG-4能把箱子减重一半,那么H.264能把箱子减重为原来的1/4,在卡车载重量不变的情况下,H.264比MPEG-2让卡车的载货量增加了二倍。 |
| H.264获得优越性能的代价是计算复杂度的大幅增加,例如分层设计、多帧参论、多模式运动估计、改进的帧内预测等,这些都显著提高了预测精度,从而获得比其他标准好得多的压缩性能。 |
| H.264 与MPEG-4的比较 |
| 在极低码率(32-128Kbps)的情况下,H.264与MPEG-4相比具有性能倍增效应,即: 相同码率的H.26L媒体流和MPEG-4媒体流相比,H.26L拥有大约3个分贝的增益(画质水平倍增)。 32Kbps的H.26L媒体流,其信躁比与128K的MPEG-4媒体流相近。即在同样的画面质量下,H.264的码率仅仅为MPEG-4的四分之一。 |
| H.264/AVC核心技术概览 |
| 这个新的标准是由下面几个处理步骤组成的: |
| 帧间和帧内预测 |
| 变换(和反变换) |
| 量化(和反量化) |
| 环路滤波 |
| 熵编码 |
| 单张的图片流组成了视频,它能分成16X16像素的“宏块”,这种分块方法简化了在视频压缩算法中每个步骤的处理过程。举例来说,从标准清晰度标准视频流解决方案(720X480)中截取的一幅图片被分成1350(45X30)个宏块,然后在宏块的层次进行进一步的处理。 |
| 帧间预测 |
| 改良的运动估计。运动估计用来确定和消除存在于视频流中不同图片之间的时间冗余。当运动估计搜索是根据过去方向的图片,那么被编码的图片称为“P帧图片”,当搜索是根据过去和将来两种方向的图片,那么被编码的图片被称为“B帧图片”。为了提高编码效率,为了包含和分离在“H.264运动估计-改良的运动估计”图中的运动宏块,宏块被拆分成更小的块。然后,以前或将来的图片的运动矢量被用来预测一个给定的块。H.264/MPEG-4 AVC发明了一种更小的块,它具有更好的灵活性,在运动矢量方面可以有更高的预测精度。 |
| H.264运动估计-改良的运动估计 |
| 帧内预测 |
| 不能运用运动估计的地方,就采用帧内估计用来消除空间冗余。内部估计通过在一个预定义好的集合中不同方向上的邻近块推测相邻像素来预测当前块。然后预测块和真实块之间的不同点被编码。这种方法是H.264/MPEG-4 AVC所特有的,尤其对于经常存在空间冗余的平坦背景特别有用。一个例子就是下边展示的“H.264内部估计”。 |
| H.264内部估计 |
| 变换 |
| 运动估计和内部估计后的结果通过变换被从空间域转换到频率域。H.264/MPEG-4 AVC使用整数DCT4X4变换。而MPEG-2和MPEG-4使用浮点DCT8X8变换。更小块的H.264/MPEG-4 AVC减少了块效应和明显的人工痕迹。整数系数消除了在MPEG-2和MPEG-4中进行浮点系数运算时导致的精度损失。 |
| H.264变换 |
| 量化 |
| 变换后的系数被量化,减少了整数系数的预测量和消除了不容易被感知高频系数。这个步骤也用来控制输出的比特率维持在一个基本恒定的常量。 |
| H.264量化/码率控制 |
| 环路滤波 |
| H.264/MPEG-4 AVC标准定义了一个对16X16宏块和4X4块边界的解块过滤过程。在宏块这种情况下,过滤的目的是消除由于相邻宏块有不同的运动估计类型(比如运动估计和内部估计)或者不同的量化参数导致的人工痕迹。在块边界这种情况下,过滤的目的是消除可能由于变换/量化和来自于相邻块运动矢量的差别引起的人工痕迹。环路滤波通过一个内容自适应的非线性算法修改在宏块/块边界的同一边的两个像素。 |
| 熵编码 |
| 在熵编码之前,4X4的量化系数必须被重排序。根据这些系数原来采用的预测算法为运动估计或者内部估计的不同来选择不同的扫描类型创建一个重排序的串行化流。扫描类型按照从低频到高频的顺序排序这些系数。既然高频系数大多数趋向于零,那么利用游程编码就可以缩减零的数目,从而高效的达到熵编码的目的。 |
| H.264熵编码-系数的串行化 |
| 在熵编码步骤通过映射符号的字节流来表示运动矢量,量化系数和宏块头。熵编码通过设计用一个较少的比特位数来表示频繁使用的符号,比较多的比特位数来表示不经常使用的符号。 |