kaiyun官方注册
您所在的位置: 首页> 可编程逻辑> 设计应用> 自适应压缩感知的语音压缩重构算法研究
自适应压缩感知的语音压缩重构算法研究
2015年电子技术应用第2期
毛 静1,2,尹鹏亮1,2,马 琦1,2,张斌珍1,2
1.中北大学 电子测试国家重点实验室,山西 太原030051; 2.中北大学 仪器科学与动态测试教育部重点实验室,山西 太原030051
摘要:根据传统语音信号的处理过程和语音信号的特征,提出了利用自适应冗余字典KSVD算法、自适应观测矩阵和SAMP重构算法的压缩重构方法,通过仿真分析,并与普通压缩感知对比平均帧重构信噪比、相对误差,验证了压缩感知自适应算法的优越性。
中图分类号:TN912
文献标识码:A
文章编号: 0258-7998(2015)02-0072-03
Research on algorithm of speech compression and recovery based on adaptive compressed sensing
Mao Jing1,2,Yin Pengliang1,2,Ma Qi1,2,Zhang Binzhen1,2
1.National Key Laboratory for Electronic Measurement Technology,North University of China,Taiyuan 030051;China; 2.Key Laboratory of Instrumentation Science & Dynamic Measurement of Ministry of Education,North University of China, Taiyuan 030051,China
Abstract:According to the speech characteristics and traditional signal processing, this paper proposes that the adaptive algorithm is joined in compressed sensing, combined with redundant dictionary KSVD adaptive algorithm, adaptive observation matrix and SAMP reconstruction algorithm. By simulation analysis and comparison with the general compressed sensing on the average frame reconstruction SNR and relative error, it is ended to verify the superiority of adaptive compressed sensing algorithm.
Key words :compressed sensing;speech signal;adaptive algorithm


0 引言

  传统的奈奎斯特采样定理要求采样率高于信号最高频率的两倍,来实现信号的采集、压缩和恢复。但随着采集数据和频率的急剧增加,压缩过程中丢弃了绝大部分采集数据,只保留了小部分来恢复信号,导致增加大量不必要的存储和传输设备。Donoho、Candès等人提出的压缩感知理论很好地解决了这个难题[1-2]。压缩感知将可稀疏的信号通过观测从高阶矩阵线性投影为低阶,信号的采集和压缩在此过程同时进行,最后高概率精确地重建原始信号。在语音信号的处理过程中,模拟信号的高采样率必然会产生海量的冗余数据,根据语音信号的可压缩性,DCT变换域以及小波变换的稀疏特性,满足压缩感知理论的先验条件[3-4]。压缩感知的理论包含三项内容:选择信号稀疏基,设计观测矩阵和重构原信号。其中信号是否具有稀疏性是前提条件;设计观测矩阵是实现的重要部分,不仅关系到压缩和采样速率的快慢,而且影响重构信号的质量;重构原始信号是压缩感知理论的核心,决定着恢复原信号质量的好坏。

1 语音自适应压缩感知的设计

  信号在稀疏矩阵变换下越稀疏,重构时所用的观测数目就越少,重建信号的效率就越高。由于语音信号具有短时稳态性,因此基于压缩感知的语音处理要先对信号进行编帧,然后利用随机观测矩阵对每帧信号压缩采样,最后逐帧恢复原信号。

  实验仿真选用的一段女生声音内容为“hello,酷狗”,共有44 100个样点,采样率为22.05 kS/s[5-6]。

1.1 自适应信号稀疏

  DCT是语音信号处理中应用较多的稀疏方法,具有很强的能量集中功能。但它属于正交基变换,信号的稀疏变换唯一,正交基的选择影响稀疏性,进而影响信号重构。冗余字典可以使信号呈现最佳稀疏,需要遵循各个基向量使输入信号达到最佳稀疏的原则。基于这种原则,冗余字典是一定非正交并且冗余的矩阵,可以通过增加稀疏基的梳理来提高变换系统的冗余性,进而增强信号逼近的灵活性,同时也提高了稀疏表示高阶信号的能力。研究采用基于K-均值的K-SVD算法作为自适应冗余字典对语音信号稀疏。K-SVD算法的方程表示为:

6W[NX__J3LX8NGK2{{Q@Y21.png

KSVD算法的相对误差和平均帧重构信噪比(AFSNR)示意如图1。KSVD算法的平均帧重构信噪比如表1所示。

  由表1的数据得到结论:经过KSVD算法稀疏得到重构语音的AFSNR随帧长和信号压缩比的增加而增大。

1.2 自适应观测矩阵

  观测矩阵的设计原则是与稀疏矩阵尽可能不相干,且自身的列矩阵之间相互独立。随机观测矩阵具有上述特点,如高斯矩阵等。在语音信号观测投影时首先对信号进行编帧,然后选择与稀疏矩阵尽量不相干的观测矩阵相乘,得到观测值。

  语音信号信号压缩比值越大,恢复信号的质量就越高;但观测值越多,其恢复时间也越长。根据语音信号每帧信息量的大小,选择相应的观测数,即自适应观测;能量大的帧分配较多的观测数,能量小的帧分配较小的观测数,噪声大部分存在于能量较小的帧,较少的观测数能起到去噪的作用。

  对已知的语音信号进行自适应观测,得到的相对误差和平均帧重构信噪比(AFSNR)如图2所示。

002.jpg

  图2的相对误差表明,语音信号的帧长对自适应观测的相对误差值几乎没有影响,而压缩比的值对信号相对误差影响也较小,自适应观测的相对误差集中在0.45左右。

  自适应观测矩阵的重构语音质量的好坏与压缩比有直接关系,但每帧信号的帧长大小对重构语音的影响微乎其微,如表2所示。

008.jpg

 1.3 自适应重构算法

  重构信号是利用优化求解的方法从观测值和稀疏矩阵中重构原信号。重建算法的设计应遵循如下原则:算法应使用较少的观测值,并且能精确和快速地恢复原信号。重构语音需要对每帧语音信号逐一进行恢复。常用的信号重构算法有BP(Basic pursuit)算法和OMP算法。

  稀疏自适应匹配追踪算法(Sparse Adaptive Matching Pursuit,SAMP)是基于OMP算法基础上提出的,SAMP算法的主要思路是:在未知稀疏度的情况下进行信号重构,然后利用逐步加大步长的方法不断增加所用的原子规模,并引入回溯思想,在每次加大步长和选择原子后,都会与上步的原子合并,最后从中选择最佳的匹配原子。SAMP算法最大的优点是在稀疏度未知的前提下能够自适应重构原信号。

  对已知语音信号采用SAMP算法进行重构,得到的相对误差和平均帧重构信噪比结果如图3所示。

003.jpg

  采用BP算法和OMP算法与SAMP算法进行比较,AFSNR结果如图4所示。

004.jpg

  以重构语音时间的角度评判,运行观测矩阵约为1 s,剩余全部为重构时间,SAMP算法用时在10 s内,OMP算法最少时间是10 s,而随着压缩比的增大,重构时间最高可达400 s,BP算法时间更长,最小为40 s,最高为2 500 s。因此使用SAMP算法会大大减小压缩感知重构语音的时间。

2 自适应压缩感知

  语音自适应压缩感知的设计流程如图5所示。

  自适应压缩感知重构语音平均帧重构信噪比如表3所示,表3的数据表明,帧长与信号压缩比对重构语音的质量有积极影响,而且信号压缩比值较小的条件下,恢复的语音质量较高;在帧长400时,压缩比的大小对重构语音影响不大,重构的语音信号达到优的级别,同时要远远高于KSVD算法、自适应观测矩阵和SAMP算法单独重构语音的质量。3种自适应算法组合一起能充分发挥各自的优点,弥补了每个算法的缺陷:减少了KSVD所产生的噪声,重构语音的相对误差成倍的降低,并且提高了重构的AFSNR,使得语音的质量更好,同时提高了信号稀疏度,降低了在重构时计算的复杂度,从而进一步减少重构语音的时间。

006.jpg

  如图6所示,相对于普通压缩感知,自适应压缩感知具有更好的重构语音信号质量,采样恢复语音时间更短,而且在信号低压缩的条件下,能恢复出良好的语音。

3 结论

  本文通过将自适应算法引入压缩感知,结合自适应冗余字典KSVD算法、自适应观测矩阵和SAMP重构算法,提出自适应压缩感知,并分别进行仿真分析,通过平均帧重构信噪比、相对误差,与普通压缩感知进行对比,验证了KSVD的稀疏的性能以及SAMP算法的优势。最后对自适应压缩感知进行仿真分析,验证了将自适应算法引入压缩感知理论的可行性。

参考文献

  [1] CANDS E,WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.

  [2] CANDS E,ROMBERG J,TAO T.Robust uncertainty prin-ciples:exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.

  [3] 余恺,李元实,王智,等.基于压缩感知的新型声信号采集方法[J].仪器仪表学报,2011,33(1):106-112.

  [4] 周小星,王安娜,孙红英,等.基于压缩感知过程的语音增强[J].清华大学学报(自然科学版),2011,51(9):1234-1238.

  [5] 罗武骏,陶文凤,左加阔,等.自适应语音压缩感知方法[J].东南大学学报(自然科学版),2012,42(6):1027-1030.

  [6] 张雪英.数字语音处理及MATLAB仿真[M].北京:电子工业出版社,2010.


此内容为AET网站原创,未经授权禁止转载。
Baidu
map