文献标识码:A
文章编号: 0258-7998(2015)02-0072-03
0 引言
传统的奈奎斯特采样定理要求采样率高于信号最高频率的两倍,来实现信号的采集、压缩和恢复。但随着采集数据和频率的急剧增加,压缩过程中丢弃了绝大部分采集数据,只保留了小部分来恢复信号,导致增加大量不必要的存储和传输设备。Donoho、Candès等人提出的压缩感知理论很好地解决了这个难题[1-2]。压缩感知将可稀疏的信号通过观测从高阶矩阵线性投影为低阶,信号的采集和压缩在此过程同时进行,最后高概率精确地重建原始信号。在语音信号的处理过程中,模拟信号的高采样率必然会产生海量的冗余数据,根据语音信号的可压缩性,DCT变换域以及小波变换的稀疏特性,满足压缩感知理论的先验条件[3-4]。压缩感知的理论包含三项内容:选择信号稀疏基,设计观测矩阵和重构原信号。其中信号是否具有稀疏性是前提条件;设计观测矩阵是实现的重要部分,不仅关系到压缩和采样速率的快慢,而且影响重构信号的质量;重构原始信号是压缩感知理论的核心,决定着恢复原信号质量的好坏。
1 语音自适应压缩感知的设计
信号在稀疏矩阵变换下越稀疏,重构时所用的观测数目就越少,重建信号的效率就越高。由于语音信号具有短时稳态性,因此基于压缩感知的语音处理要先对信号进行编帧,然后利用随机观测矩阵对每帧信号压缩采样,最后逐帧恢复原信号。
实验仿真选用的一段女生声音内容为“hello,酷狗”,共有44 100个样点,采样率为22.05 kS/s[5-6]。
1.1 自适应信号稀疏
DCT是语音信号处理中应用较多的稀疏方法,具有很强的能量集中功能。但它属于正交基变换,信号的稀疏变换唯一,正交基的选择影响稀疏性,进而影响信号重构。冗余字典可以使信号呈现最佳稀疏,需要遵循各个基向量使输入信号达到最佳稀疏的原则。基于这种原则,冗余字典是一定非正交并且冗余的矩阵,可以通过增加稀疏基的梳理来提高变换系统的冗余性,进而增强信号逼近的灵活性,同时也提高了稀疏表示高阶信号的能力。研究采用基于K-均值的K-SVD算法作为自适应冗余字典对语音信号稀疏。K-SVD算法的方程表示为:
KSVD算法的相对误差和平均帧重构信噪比(AFSNR)示意如图1。KSVD算法的平均帧重构信噪比如表1所示。
由表1的数据得到结论:经过KSVD算法稀疏得到重构语音的AFSNR随帧长和信号压缩比的增加而增大。
1.2 自适应观测矩阵
观测矩阵的设计原则是与稀疏矩阵尽可能不相干,且自身的列矩阵之间相互独立。随机观测矩阵具有上述特点,如高斯矩阵等。在语音信号观测投影时首先对信号进行编帧,然后选择与稀疏矩阵尽量不相干的观测矩阵相乘,得到观测值。
语音信号信号压缩比值越大,恢复信号的质量就越高;但观测值越多,其恢复时间也越长。根据语音信号每帧信息量的大小,选择相应的观测数,即自适应观测;能量大的帧分配较多的观测数,能量小的帧分配较小的观测数,噪声大部分存在于能量较小的帧,较少的观测数能起到去噪的作用。
对已知的语音信号进行自适应观测,得到的相对误差和平均帧重构信噪比(AFSNR)如图2所示。
图2的相对误差表明,语音信号的帧长对自适应观测的相对误差值几乎没有影响,而压缩比的值对信号相对误差影响也较小,自适应观测的相对误差集中在0.45左右。
自适应观测矩阵的重构语音质量的好坏与压缩比有直接关系,但每帧信号的帧长大小对重构语音的影响微乎其微,如表2所示。
1.3 自适应重构算法
重构信号是利用优化求解的方法从观测值和稀疏矩阵中重构原信号。重建算法的设计应遵循如下原则:算法应使用较少的观测值,并且能精确和快速地恢复原信号。重构语音需要对每帧语音信号逐一进行恢复。常用的信号重构算法有BP(Basic pursuit)算法和OMP算法。
稀疏自适应匹配追踪算法(Sparse Adaptive Matching Pursuit,SAMP)是基于OMP算法基础上提出的,SAMP算法的主要思路是:在未知稀疏度的情况下进行信号重构,然后利用逐步加大步长的方法不断增加所用的原子规模,并引入回溯思想,在每次加大步长和选择原子后,都会与上步的原子合并,最后从中选择最佳的匹配原子。SAMP算法最大的优点是在稀疏度未知的前提下能够自适应重构原信号。
对已知语音信号采用SAMP算法进行重构,得到的相对误差和平均帧重构信噪比结果如图3所示。
采用BP算法和OMP算法与SAMP算法进行比较,AFSNR结果如图4所示。
以重构语音时间的角度评判,运行观测矩阵约为1 s,剩余全部为重构时间,SAMP算法用时在10 s内,OMP算法最少时间是10 s,而随着压缩比的增大,重构时间最高可达400 s,BP算法时间更长,最小为40 s,最高为2 500 s。因此使用SAMP算法会大大减小压缩感知重构语音的时间。
2 自适应压缩感知
语音自适应压缩感知的设计流程如图5所示。
自适应压缩感知重构语音平均帧重构信噪比如表3所示,表3的数据表明,帧长与信号压缩比对重构语音的质量有积极影响,而且信号压缩比值较小的条件下,恢复的语音质量较高;在帧长400时,压缩比的大小对重构语音影响不大,重构的语音信号达到优的级别,同时要远远高于KSVD算法、自适应观测矩阵和SAMP算法单独重构语音的质量。3种自适应算法组合一起能充分发挥各自的优点,弥补了每个算法的缺陷:减少了KSVD所产生的噪声,重构语音的相对误差成倍的降低,并且提高了重构的AFSNR,使得语音的质量更好,同时提高了信号稀疏度,降低了在重构时计算的复杂度,从而进一步减少重构语音的时间。
如图6所示,相对于普通压缩感知,自适应压缩感知具有更好的重构语音信号质量,采样恢复语音时间更短,而且在信号低压缩的条件下,能恢复出良好的语音。
3 结论
本文通过将自适应算法引入压缩感知,结合自适应冗余字典KSVD算法、自适应观测矩阵和SAMP重构算法,提出自适应压缩感知,并分别进行仿真分析,通过平均帧重构信噪比、相对误差,与普通压缩感知进行对比,验证了KSVD的稀疏的性能以及SAMP算法的优势。最后对自适应压缩感知进行仿真分析,验证了将自适应算法引入压缩感知理论的可行性。
参考文献
[1] CANDS E,WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.
[2] CANDS E,ROMBERG J,TAO T.Robust uncertainty prin-ciples:exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.
[3] 余恺,李元实,王智,等.基于压缩感知的新型声信号采集方法[J].仪器仪表学报,2011,33(1):106-112.
[4] 周小星,王安娜,孙红英,等.基于压缩感知过程的语音增强[J].清华大学学报(自然科学版),2011,51(9):1234-1238.
[5] 罗武骏,陶文凤,左加阔,等.自适应语音压缩感知方法[J].东南大学学报(自然科学版),2012,42(6):1027-1030.
[6] 张雪英.数字语音处理及MATLAB仿真[M].北京:电子工业出版社,2010.