kaiyun官方注册
您所在的位置: 首页> 其他> 业界动态> 具有感兴趣区域的静止图像压缩编码算法研究

具有感兴趣区域的静止图像压缩编码算法研究

2008-09-01
作者:张 兢, 路彦和

摘 要:在研究人眼视觉掩盖效应的基础上,采用了一种感兴趣区域的嵌入式零树小波" title="小波">小波编码算法(EZW_ROI算法),对感兴趣的区域和不感兴趣区域分别进行编码, 充分利用了信道资源和存储空间,提高感兴趣区域的图像质量" title="图像质量">图像质量,使重建图像视觉效果更好。
关键词:图像压缩小波变换" title="小波变换">小波变换视觉掩盖效应 EZW_ROI算法


  被誉为数学显微镜的小波变换是从傅里叶变换和加窗傅里叶变换发展而来的。小波变换引入伸缩和平移两个参数,实现了时域-频域局域化分析,从而可以对图像的任何局部区域进行多分辨率分析。由于小波变换后图像具有高频的方向选择性,与人眼的视觉特性相吻合,人眼最重要的视觉特性是视觉掩盖效应,即不变和有规则变化的区域很容易被遗忘,而对突变和极不规则变化的区域感兴趣。采用嵌入式零树小波编码及算法,通过对感兴趣的区域和不感兴趣区域分别进行编码,可以达到充分利用信道资源和存储空间、提高感兴趣区域的图像质量的目的。
1 视觉掩盖效应
  在大多数应用场合,最终的图像总是由人眼来观测的,但是人类的视觉系统并不完美。通过对人眼视觉现象的观察与研究发现,视觉掩盖效应可以用于改善图像信息的处理。
  视觉选择性与客体的特性有关,人眼对空间频率" title="空间频率">空间频率接近于零的平滑区域和空间频率相似纹理区域有很大的钝性,所以不变与规则变化的场景很容易在人的意识中被遗忘,人类视觉通常只对突变和极不规则变化的区域感兴趣。这种与生俱来的选择性使视觉只限定在有限的目标上。
1.1 静态对比灵敏度
  人眼主观上可辨别的最小亮度差别所需要的最小光强差值称为亮度的辨别阀值。也就是说,当刺激光强I增大时,最初感觉不出,直到I变化到I+△I时人眼就感觉到亮度有变化了。人眼对亮度光强变化的响应是非线性的,比值△I/I称为对比灵敏度。在相当宽的光强范围内,△I/I保持常数为0.02,但在I很低或很高时不是常数。如果有背景,则对比灵敏度不仅与目标物的光强度I有关,而且与背景亮度I0有关。图1给出了有背景和无背景时人眼的静态对比灵敏度曲线。


  此外,人眼的对比灵敏度还与刺激的空间变化周期(空间变化周期是指刺激的明暗不变,只改变明暗的空间间隔)有关。如果亮度固定在一定水平下,则对比灵敏度与光刺激的空间变化周期之间的关系如图2所示。这一关系通常被称为人眼的调制传递函数。图2中还给出了等亮度的色差信号Y-R和Y-B的对比灵敏度曲线。由图1和图2可得到以下结论:
  (1)恢复图像的误差如果低于对比灵敏度,则不会被人眼觉察。
  (2)高频部分在相同的灵敏度阈值下,色差信号Y-R的空间频率只有亮度Y的一半,Y-B则为Y的1/4,通常表示色差信号所需的像素比亮度要少得多。
  (3)在相同的灵敏度阈值下,斜向栅格的空间频率只有正常栅格的0.7,因此按斜向栅格对图像数据采样所需的频率较低。
  (4)高频端的灵敏度要小于低频端,因此对这些部分的量化误差可大一些。
1.2 具有感兴趣区域的人眼视觉特性
  人们在观察和理解图像时常常不自觉地对其中某些区域产生兴趣,把这些区域称为视觉感兴趣区域。整幅图像的主观视觉质量取决于感兴趣区域的视觉质量,而不感兴趣区域的降质常常不易被人觉察,对整幅图像视觉质量的影响较小。例如对一副人像照片,反映一个人主要特征的是面部信息,在进行图像压缩时,人的面部信息与其它不重要的信息不必采用相同的压缩比。显然,感兴趣区域的视觉特性也是一种视觉掩盖效应。
2 嵌入式零树小波编码及算法
2.1 EZW编码

  一幅图像经过三级小波分解后形成十个子带,如图3所示。小波系数的分布特点是越往低频子带,系数值越大,包含的图像信息越多。如图3中的LL3子带,越是高频子带,系数值越小,包含的图像信息越小。在系数数值相同时,低频子带反映图像的低频信息,对视觉比较重要;而高频子带反映图像的高频信息,对视觉不太重要。应选择先传输较低频系数的重要比特,后传输较高频系数的重要比特。正是由于小波系数具有的这些特点,它非常适合于嵌入式编码算法。


  嵌入式零树小波编码EZW(Embedded Zerotree Wavelet)方法是对整幅图像进行同一级别编码的方法,图像中的重要区域(感兴趣区域)与背景区域(非感兴趣区域)具有同样的编码级数。EZW编码算法是一个简单而有效的图像编码" title="图像编码">图像编码算法,这种算法得到的比特流中的比特按其重要性排序。使用这种算法,编码者能够在任一点结束编码,允许精确到任一个目标比特率或目标失真率。
2.2 EZW算法
  EZW算法利用小波系数的特点较好地实现了图像编码的嵌入功能,为了改善小波系数重要图的压缩,定义了一个零数的数据结构,即一个小波系数x。对于一个给定的门限T,如果|x|<T,则称小波系数x是不重要的。如果一个小波系数在一个粗尺度上,关于给定的门限是不重要的,且之后在较细的尺度上,对同样空间位置中的所有小波系数关于给定的门限T也是不重要的,则称小波系数形成了一个零数。这时,在粗尺度上的那个小波系数称为母代小波系数,它是树根,在较细尺度相应位置上的小波系数称为子代小波系数。如果一个小波系数关于门限T是不重要的,但它的子代小波系数中关于门限T是重要的系数,则称这个小波系数是孤立零。因此,小波系数有三种情况:零数根(ZTR)、孤立零(IZ)、重要系数。当然,为了编码的需要还可把重要系数分为正重要系数(POS)和负重要系数(NEG)。
  对于一个图像的数据流,图4给出了一个系数编码的流程图。


3 具有感兴趣区域的静止图像压缩编码算法研究
3.1 EZW_ROI编码算法
  为了提高感兴趣区域的图像质量,在信道资源和存储空间有限的条件下,提出感兴趣区域的零树编码算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它对感兴趣区域图像和背景图像采用不同的压缩步骤,使感兴趣区域内的图像比背景图像具有更好的图像质量。
  对感兴趣区域内外的图像采用不同的零数小波编码。整个编码算法分三步进行:
  (1)确定感兴趣区域:人像照片可以把感兴趣区域确定为面部区域。在视频监视系统中,可以把监视环境中的重要场景设为感兴趣区域。
  (2)对低频子带中感兴趣区域内的系数进行编码:即对感兴趣区域内的图像进行编码,系数采用EZW算法的零树结构,按照EZW算法的思想进行零树扫描和编码。
  (3)对低频子带中不在感兴趣区域内的系数进行编码:即对背景区域的图像进行编码,系数的编码不用EZW算法的零树结构,只对背景区域的低频信息进行编码。
  图5是EZW_ROI算法的编码结构框图。


3.2 EZW_ROI解码算法
  对编码图像进行解码时,与编码过程相反,也分三步进行:
  (1)对低频子带中的感兴趣区域内图像进行与EZW算法同样的零树编码。
  (2)对低频子带中的感兴趣区域外图像进行简单的位解码。
  (3)消除边缘效应:在以上两步的基础上,对感兴趣区域的四周做3×3的均值滤波,以消除感兴趣区域边缘的影响,使得感兴趣区域外的图像在视觉上差别变弱。
  图6 是EZW_ROI算法的解码结构框图。


4 应用实例
  在研究中采用了一幅标准的8bpp的灰度人像,首先,确定感兴趣区域为人像的面部,对原始图像进行四级的小波分解,小波变换采用S+P变换;最后对图像进行32倍压缩,即压缩后的比特率为0.25bpp。用EZW算法和EZW_ROI算法恢复的图像如图7所示。在信道资源和存储空间有限的条件下,为了提高感兴趣区域的图像质量,采用具有感兴趣区域的图像压缩方式,对感兴趣区域图像和背景图像采用不同的压缩步骤,使图像中的重要信息尽可能少损失。试验证明,在高压缩比的情况下,EZW_ROI算法的重建图像比EZW算法的重建图像具有更好的视觉效果。


参考文献
1 李建平.小波分析与信号处理. 重庆:重庆出版社,1997
2 沈兰荪. 视频编码与低速率传输.北京:电子工业出版社,2001
3 徐佩霞,孙功宪. 小波分析与应用实例.合肥:中国科技大学出版社,2001
4 姚庆栋.图像编码基础.北京:人民邮电出版社,1984
5 Jerome M.Shapiro.Embedded Image Coding Using Zerotrees of Wavelets Cofficients.IEEE Trans on Signal Processing.1993;41(12):3445~3462
6 Chui C K. An introduce to wavelets.New York:Academic Press,1992;134~200

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。
Baidu
map