文献标识码:A
DOI:10.16157/j.issn.0258-7998.172043
中文引用格式:张秀再,王婷,郭业才,等. 基于维纳后置滤波的LS波束形成混响抑制算法[J].电子技术应用,2018,44(3):131-134.
英文引用格式:Zhang Xiuzai,Wang Ting,Guo Yecai,et al. Reverberation suppression algorithm for LS beamforming based on Wiener post-filter[J]. Application of Electronic Technique,2018,44(3):131-134.
0 引言
麦克风阵列能够准确获取空间信息,广泛地应用于电话会议、免提语音通信、人机语音交互和助听设备等系统[1]。波束形成是一种重要的麦克风阵列处理技术,其主要目的是对特定方向的有用信号形成波束,同时抑制其他方向的干扰信号和噪声[2]。近年随着人们对语音通信研究的深入,麦克风阵列得到更加广泛地应用。
在具有多个分布式麦克风的语音通信应用中,通常期望量化每个传感器处感知信号的混响量,以便选择具有最高质量或最小混响的频道。假设不同信道上的噪声之间不相关的前提下,ZELINSKI R[3]提出具有维纳后置滤波的波束形成器,利用空间信息解决了维纳滤波器的估计问题。但这种非相干噪声场实际上很少遇到,特别是低频噪声场。BERKUN R[4]和MARRO C[5]提出基于麦克阵列与维纳后置滤波器结合的降噪和去混响算法。MCCOWAN I[6]基于噪声场复相干的假设知识开发滤波器估计的更一般表达式,但该算法要求预先得到噪声相干函数,适用范围受到限制。SIMMER K U[7]提出的多通道维纳滤波器(MCWF),其可以分解为最小方差无失真响应波束形成器和单通道后置滤波器,求最优解表达式,对混响中语音质量改善明显。LUEBS A[8]在白噪声和漫反射噪声的基础上增加点干扰处理,通过提供全局最优的最小二乘解决方案,更有效地利用麦克风阵列收集的信息,提高语音质量。
本文提出具有维纳后置滤波的最小二乘波束形成混响抑制算法。该算法对含混响语音信号通过分频得到高频和低频分量,用LS波束形成算法分别进行处理后叠加,并进行维纳后置滤波,再由逆傅里叶变换得到去混响后的语音信号。计算机仿真结果证明,本文提出的基于维纳后置滤波的LS波束形成混响抑制算法具有较好的混响抑制能力。
1 信号模型
1.1 最小二乘波束形成算法
设基阵为M元均匀线阵,每个阵元通道后有一个L阶FIR滤波器,接收宽带信号的频率带宽Nf为[fl,fh],信号的传播方向与基阵法线方向的夹角为θ,阵元间距d。在最小二乘波束形成器的设计方法[2,9]中,将代价函数定义为:
1.2 具有维纳后置滤波的波束形成器
ZELINSKI R[3]提出的自适应后置滤波器结构如图1所示。其中,A(i)表示第i个通道的自功率谱密度,C(i)表示互功率谱密度,y(t)为输出信号。该系统首先对麦克风阵列接收的语音信号进行时延补偿。把第i个通道接收到的信号xi(t)表示为:
1.3 基于维纳后置滤波的LS改进波束形成
根据LEBART K和BOUCHER J M提出的假设[10],即基于房间脉冲响应h(k)是一个随机过程,表示为:
假设sd(k)与sr(k)分别表示纯净语音信号s(t)与hd(k)和hr(k)的卷积,则sd(k)为待处理语音信号的直达信号部分,sr(k)为待处理语音信号的混响部分。
由以上分析得到改进维纳滤波器的估计增益[5]:
因为衰减因子Δ与混响时间T60存在联系,而不同频段的混响时间不同,故Δ是随着特定房间对不同频率的衰减和反射程度而改变的,即不同频率的声信号产生的混响有一定的差异,并且在实际声场中低频部分噪声相干性较强,因此采用分频处理的思想,将傅里叶变换后的信号分为高频和低频分量,频率分界点取为1 kHz。令α为加权矩阵系数,是正常数,将高、低频权矢量hL、hH分别相加,即将分频后的信号,用LS波束形成算法分别进行处理后再求和,将得到的信号Y(ω)进行维纳后置滤波,最后将信号进行逆傅里叶变换得到去混响后的语音信号。基于维纳后置滤波的LS改进波束形成结构如图2所示。
由式(5)、式(12)可求得改进波束形成器的最优权向量为:
2 实验与评估
仿真环境:采用6个麦克风传感器均匀线阵,其中声源位置(-5,1,0),最左边第一个麦克风位置为(-5,2,1),麦克风阵元间隔1 m。四面墙、地板、天花板的反射系数分别为0.9,0.95,0.9,0.95,0.2,0.4。房间的对角坐标为(-7,-3,0),(1,3,1.24)。本实验将一段纯净语音信号(第一课欢迎新同学)与房间脉冲响应函数做卷积得到混响后的信号,纯净语音信号采样频率fs为8 000 Hz,持续2.3 s。从两个指标对提出的算法进行验证。
(1)语谱图:如图3用三维的方式显示语音频谱特性,是一种动态的频谱。用颜色深浅表示特定频带的能量大小。
图3(a)为纯净语音信号的语谱图;图3(b)为混响语音信号的语谱图,从该图可知共振峰前后重叠较严重,在横轴(时间轴)上语音信号出现约0.17 s的延迟,语音质量受损严重;图3(c)中单通道维纳滤波算法虽然对混响有一定的抑制作用,但是信号失真仍严重;图3(d)中本文提出的算法对混响抑制效果较好,对信号失真改善较明显。
(2)采用语音质量感知评价(Perceptual Evaluation of Speech Quality,PESQ)对去混响的效果进行评估,PESQ表示为:
式中,Dind、Aind分别是平均干扰值和平均的线性组合获得的对称干扰值。从表1中看出,加入混响后语音信号的PESQ下降为1.9,语音信号的质量严重下降。经过本文提出算法进行混响抑制后PESQ达到2.3。
3 总结
本文提出的具有维纳后置滤波的最小二乘波束形成混响抑制算法将混响后的信号分为直达部分和混响部分,得到改进维纳后置滤波器增益估计,然后用最小二乘波束形成算法将信号进行分频处理,最后求解最优权值,并通过仿真实验分别从信号的语谱图和语音质量感知指标对算法进行评估。仿真实验结果表明,相对于维纳混响算抑制算法,本文提出算法混响抑制效果更加显著。
参考文献
[1] LOIZOU P C.Speech enhancement:Theory and practice[M].CRC Press,Inc.2013.
[2] DOBLINGER G.Optimization of wideband fixed beamformers with adaptive sensor calibration[C].Signal Processing Conference,2010,European.IEEE,2010:2062-2066.
[3] ZELINSKI R.A microphone array with adaptive post-filtering for noise reduction in reverberant rooms[C].International Conference on Acoustics,Speech,and Signal Processing.IEEE,2002,5:2578-2581.
[4] BERKUN R,COHEN I.Microphone array power ratio for quality assessment of reverberated speech[J].EURASIP Journal on Advances in Signal Processing,2015(1):1-11.
[5] MARRO C,MAHIEUX Y,SIMMER K U.Analysis of noise reduction and dereverberation techniques based on micro-phone arrays with postfiltering[J].IEEE Transactions on Speech & Audio Processing,2002,6(3):240-259.
[6] MCCOWAN I,BOURLARD H.Microphone array post-filter based on noise field coherence[J].IEEE Transactions on Speech & Audio Processing,2003,11(6):709-716.
[7] SIMMER K U,BITZER J,MARRO C.Post-filtering techniques[M].Microphone Arrays. Springer Berlin Heidelberg,2001:39-60.
[8] HUANG Y A,LUEBS A,SKOGLUND J,et al.Globally optimized least-squares post-filtering for microphone array speech enhancement[C].IEEE International Conference on Acoustics,Speech and Signal Processing.IEEE,2016:380-384.
[9] 王燕,吴文峰,梁国龙.基于稳健最小二乘的鲁棒波束形成[J].电子学报,2013,41(12):2321-2326.
[10] LEBART K,BOUCHER J M,DENBIGH P N.A new method based on spectral subtraction for speech dereverberation[J].Acta Acustica United With Acustica,2001,87(3):359-366.
作者信息:
张秀再1,2,王 婷1,郭业才1,2,陈小燕1
(1.南京信息工程大学 电子与信息工程学院,江苏 南京210044;
2.江苏省大气环境与装备技术协同创新中心,江苏 南京210044)