图像编码技术的研究和应用 2005年第2卷第4期 | 39康复网

　　本文介绍了图像编码的基本原理及当前比较新的编码技术，如:第二代编码技术、小波变换编码、分形图像编码、模型图像编码和神经网络编码技术。

　　1 引言

　　一幅二维图像可以表示为将一个二维亮度函数通过采样和量化而得到的一个二维数组。这样一个二维数组的数据量通常很大，从而给存储、处理和传输都带来了许多问题，相应地提出了许多新的要求。为此人们试图采用关于图像的新的表达方法以减少表示一幅图像需要的数据量，这就是图像编码所要解决的主要问题。压缩数据量的主要方法是消除冗余数据，从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集。这个转换要在图像进行存储、处理和传输之前进行，而在这之后需要将压缩了的图像解压缩以重建原始图像或其近似图像。图像压缩和图像解压缩，通常也分别称为图像编码和图像解码。

　　这里给出了一个通用的图像编码系统模型，见图1。这个模型主要包括2个通过信道级连接的结构模块:编码器和解码器。当一幅输入图像送入编码器后，编码器根据输入数据进行信源编码产生一组信号。这组信号再进一步被信道编码器编码后进入信道，通过信道传输后的码被送入信道解码器和信源解码器，解码器重建输出的图像。一般来说，输出图是输入图的精确复制，那么系统是无失真的或者信息保持型的;否则，称系统是信息损失的。

　　图1 通用的图像编码系统模型（略）

　　信源编码器的作用是减少或消除输入图像中的编码冗余、像素间冗余及心理视觉冗余。尽管信源编码器的结构与具体应用和对保真度的要求有关，但一般情况下信源编码器包括顺序的3个独立操作，而对应的信源解码器包含反序的2个独立操作，见图2。在信源编码器中，映射器将输入数据变换以减少表达图像的数据，这与具体编码技术有关。量化器根据给定的保真度准则减少映射器输出的精确度。这个操作可以减少心理冗余，但不可翻转。符号编码器产生表达量化器输出的码本，并根据码本输出。符号编码器编码为了减少冗余，这个操作是可以反转的。

　　图2 源编码器和源解码器模型（略）

　　当信道是有噪声的或者容易产生误差时，信道编码器和信道解码器对这个编解码过程是非常重要的。由于信源编码器的输出数据一般只有很少的冗余，所以他们对传输噪声很敏感。信道编码器通过把可控制的冗余加入信源编码器后的码字以减少信道噪声的影响。

　　2 现代编码方法

　　这里介绍了几种比较热点的编码方法:第二代编码方法、分形编码、模型编码、神经网络编码、小波变换编码。

　　2.1 第二代图像编码方法第二代图像编码方法［1］是针对传统编码方法中没有考虑人眼对轮廓、边缘的特殊敏感性和方向感知特性而提出的。它认为传统的第一代编码技术以信息论和数字信号处理技术为理论基础，出发点是消除图像数据的统计冗余信息，包括信息熵冗余、空间冗余和时间冗余。其编码压缩图像数据的能力已接近极限，压缩比难以提高。第二代图像编码方法充分利用人眼视觉系统的生理和心理视觉冗余特性以及信源的各种性质以期获得高压缩比，这类方法一般要对图像进行预处理，将图像数据根据视觉敏感性进行分割。

　　按处理方法的不同，第二代图像编码方法可分为两种典型的编码技术［2］ :一种是基于分裂合并的方法，先将图像分为纹理和边缘轮廓，然后各自采用不同的方法编码;另一种是基于各向异性滤波器的方法，先对图像进行方向性滤波，得到不同方向的图像信息，再根据人眼的方向敏感性对各个通道采用特定的方法单独编码。

　　但是到目前为止，第二代图像编码方法复原图像的质量不尽如人意。原因之一在于我们对人眼视觉特性的了解仍较为肤浅;原因之二是图像的分裂合并算法、各向异性滤波算法没有提供一种很好的机制来利用已知的人眼视觉特性。然而这种编码方法强调利用人眼视觉特性的思想对后来各种图像编码方法的研究产生了深刻的影响。

　　2.2 分形图像编码分形图像编码是在分形几何理论的基础上发展起来的一种编码方法。分形理论是欧氏几何相关理论的扩展，是研究不规则图形和混沌运动的一门新科学。它描述了自然界物体的自相似性，这种自相似性可以是确定的，也可以是统计意义上的。这一理论基础决定了它只有对具备明显自相似性或统计自相似性的图像，例如海岸线、云彩、大树等才有较高的编码效率。而一般图像不具有这一特性，因此编码效率与图像性质学特性有关，而且分形图像编码方法实质上是通过消除图像的几何冗余度来压缩数据的，根本没有考虑人眼视觉特性的作用。

　　分形图像压缩的概念是20世纪80年代中后期由Barnsley等人提出的，其理论基础是迭代函数系统（IFS:Iter-ated Function System）理论，着眼点是利用自然图像普遍存在的自相似特性（几何尺度不论怎样变化，景物任何一小部分的形状都与较大部分的形状极其相似），将这些自相似的结构以某种函数映射关系的形式表现出来，当这些函数映射关系满足一定的条件时，就可通过迭代计算重建图像。所以，分形图像编码过程是找映射关系的过程，而解码过程则是依照映射关系迭代计算的过程。整个方法包括以下步骤:（1）将原图（集合X）予分割为若干分形子图X（m），m=1，2，3…M;（2）对每一个子块X（m）提取IFS代码;（3）对IFS代码进行编码、传输（或储存）;（4）译码形成IFS代码;（5）由IFS代码构造X（m）的重构子块Y（m）;（6）由Y（m）构造X的重构图Y。这种分形图像压缩方法的实现不需要对图像有什么先验知识的了解。

　　2.3 基于模型的图像编码基于模型的图像编码技术［3］是近几年发展起来的一种很有前途的编码方法。它利用了计算机视觉和计算机图形学中的方法和理论，其基本出发点是在编、解码两端分别建立起相同的模型，针对输入的图像提取模型参数，或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数，其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模，一般要求对输入图像要有某些先验知识。目前研究最多、进展最快的是针对可视电话应用中的图像序列编码。这类应用中的图像大多为人的头肩像。

　　基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息，并以模型参数的形式表示它们，因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题，例如:（1）模型法需要先验知识，不适合于一般的应用。（2）对不同的应用所建模型是不一样的。（3）在线框模型中控制点的个数不易确定，还未找到有效的方法能根据图像内容来选取。（4）由于利用模型法压缩后复原图像的大部分是用图形学的方法产生的，因此看起来不够自然。（5）传统的误差评估准则不适合用于对模型编码的评价。

　　2.4 神经网络图像编码在图像编码的各种方法中，除信息保持型编码方法外，其余所有方法始终没有解决好如何充分利用人的视觉特性这个问题。神经网络图像编码［4］试图在此有所突破，现在直接用于图像压缩的神经网络主要有BP网络和自组织映射神经网络。采用BP网络实现数据压缩好比是强迫数据通过细腰型网络的瓶颈，并期望在网络的瓶颈处能获得较紧凑的数据表示。

　　图3给出了BP网络进行数据压缩的原理，这是一n-m-n型三层BP神经网络，输入层有n个神经元。通过BP训练算法，在网络的学习过程中调整网络的权重，使训练集图像的重建误差E=|X-Z|2均值达到最小（X为输入层样本集，Z为输出层样本集），或者说，使重建图像在均方误差意义上尽可能地相似于原始图像。训练后的神经网络便可用来进行图像压缩，隐层神经元矢量Y为压缩结果。

　　图3 BP神经网络压缩图（略）

　　自组织映射神经网络中的神经元可以自动地根据外部刺激的兴奋点来调整自己在由外界信号决定的参数空间中的位置。以一种双层神经网络为例:其中输入层神经元（x1，x2，x3，…xn）简单地反映着外部刺激，在输出层中，M个神经元排布成二维网络，其中每个神经元j接收两类输入:来自输入层神经元i的输入xi（权重为Wij）和来自输出层神经元的固定权重。对每一个外界输入矢量X=（x1，x2，x3，…xn），只有一个同该输入的距离d1=f（X，Wj），Wj=（W1j，W2j，W3j，…Wnj）为最小的神经元j才被激发。其中，距离函数f（X，Wj）反映了在某一准则（一般为平方误差准则）下，矢量X与Wj之间的距离。在网络的训练中我们只需要提供输入矢量X，通过调整从公共的外部输入到每个神经元j的连接权重Wj，权重矢量将逐渐指向输入矢量空间的聚类。从而实现了输入空间的维数压缩，完成了类似于矢量量化的功能。

　　2.5 小波图像编码一维连续小波变换可看成原始信号和一组不同尺度的小波带通滤波器的滤波运算，从而可把信号分解到一系列频带上进行分析处理，将其离散化后即为离散小波变换。

　　小波变换图像编码压缩［5］的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像的大部分能量，即包含图像的基本特性。它在图像重构算法中起主导作用，对重建图像的质量有很大影响，因此这部分信号应精确保留。

　　高频子图像的系数分布符合广义高斯分布，对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性，根据对人眼视觉系统的研究可知，人眼视觉灵敏度具有明显的低通特性，而且对不同方向上的敏感度也不一样，尤其是对倾斜方向的刺激不太敏感，如人眼对对角线方向子图像系数误差敏感度较低，因此可对对角线方向子图像进行粗量化高压缩。

　　小波变换后的能量主要集中在低频系数分量，而其他高频系数分量大多为零值，这为高倍率压缩提供了可能。通过选择合适的具有平滑特性的小波基，就可消除重建图像中出现的方块效应，减小量化噪声，获得较好的重建图像质量。

　　小波变换图像编码压缩方法可分为如下两大类:基于传统的图像编码方法、基于分形理论的小波变换图像编码方法。

　　基于传统的图像编码方法［6］包括:零树小波编码、基于塔式网格矢量量化的小波变换编码、基于LBG算法的小波变换编码、基于标量量化的小波变换编码等。

　　由于不同分辨率级子图像之间存在着相似性，因此，利用此相似性，可提高压缩比［7］。J.M.Shapiro采用零树自嵌套编码方法，对小波分解系数进行压缩，在PSNR=27.54dB的情况下，获得的压缩比为128∶1。这是最著名的一种小波变换图像编码压缩方法。该方法的优点是:与传统的DCT编码相比，它既可以克服方块效应，又可以在低比特率下获得较好的图像主观质量。缺点是:由于它对各子带采用相同的门限量化，因此不能充分利用人眼的视觉特性，限制了图像压缩比的进一步提高。对此，A.Said等人提出了改进算法。

　　针对分形图像编码尚存在的缺点，如编码算法的耗时、自然图像不一定具有严格的分形结构而无法达到预期的高压缩比、高压缩倍率时的方块效应等，有人提出了基于小波变换的分形编码［8］。它具有以下特点:其一，采用平滑小波可去除传统分形变换中存在的方块效应;其二，小波表示使图像的四叉树分割十分自然;其三，可将零树算法看成是该算法的一个特例。图像经过金字塔形离散小波变换后的系数在小波域内可组成分层树状数据结构———小波树，这些跨越不同分辨率的小波树之间存在一定的相似性，可通过分形变换来描述。基于小波变换的分形压缩过程就是一个由分层树状结构的顶部开始一层层地向下预测其余系数的过程，而这个由上至下、由粗至细的预测过程是通过分形编码来实现的。

　　基于小波变换的图像编码压缩的特点是［9］ :压缩比高，压缩速度快，压缩后能保持信号与图像的特征不变，且在传递过程中就可以抗干扰。从现在的研究结果可看到，该方法已获得了较好的编码效果，是现代图像压缩技术研究的热点之一，也是十分有前途的一种方法。

　　3 小结

　　本文介绍了图像编码的基本原理和几种比较新的编码方法。第二代图像编码将视觉特性引入到图像编码技术，分形图像编码是以分形几何理论为基础，基于模型的图像编码是利用了计算机视觉和计算机图形学中的理论，而小波变换图像编码则引入了小波分析理论。尽管它们理论基础不同，但它们均在不同情况下不同程度地提高了编码质量。相比之下，小波变换图像编码是一种性能更佳的图像编码方法，仅从去除冗余信息的角度而言，它的性能就远远优于其他几种编码方法。另外，将小波变换与其他的新型编码方法结合，也是小波图像编码方法的重要研究方向。

　　参考文献

　　1 万建伟，黄埔堪，周良柱，等.图像编码技术的发展.系统工程与电子技术，1996，5:31-38.

　　2 张雪松，倪国强，周立伟，等.图像编码技术发展综述.光学技术，1997，3:37-41.

　　3 曹宁，吴琰，冯晔.模型基方法在图像编码中的应用与改进.河海大学学报，1997，25（6）:97-101.

　　4 陈红丽.几种新型的图像编码技术.淮北煤师院学报，2001，22（2）:28-30.

　　5 吴谨.图像编码与小波变换图像编码.武汉科技大学学报（自然科学版），2000，23（3）:289-292.

　　6 陈雷霆，吉家成，傅志中，等.小波图像编码与JPEG图像编码的比较研究.计算机应用，2000，20（增刊）:273-277.

　　7 唐良瑞.小波图像编码技术的研究.北方工业大学学报，2001，13（3）:9-13.

　　8 刘辰昀，谭赫良，彭小燕，等.基于小波变换的图像编码.湖南大学学报（自然科学版），2002，29（3）:54-60.

　　9 陈加忠，周敬利，余胜生，等.图像编码中的重要区域相关性研究及应用.计算机学报，2001，24（3）:326-330.

　　（编辑田雨）

　　作者单位:157011黑龙江牡丹江医学院

作者：陈志国徐春环 2005-11-8