kaiyun官方注册
您所在的位置: 首页> 其他> 设计应用> 面向船载远程会议的麦克风阵列高精度DOA估计
面向船载远程会议的麦克风阵列高精度DOA估计
2022年电子技术应用第3期
刘雨佶1,2,3,童 峰1,2,3,陈东升1,2,3,卢荣富4,冯万健4
1.厦门大学 水声通信与海洋信息技术教育部重点实验室,福建 厦门361002;2.厦门大学 海洋与地球学院,福建 厦门361002; 3.厦门大学深圳研究院,广东 深圳518000;4.厦门亿联网络技术股份有限公司,福建 厦门361000
摘要:随着船舶智能化水平提高,船载远程会议系统对提高应急处理能力、推进船岸一体化网络建设有重要意义,麦克风阵列是保证远程会议系统语音效果和支持多模态交互的重要语音前端。但船舶舱室狭小尺寸一方面导致只能采用小尺寸麦阵,另一方面小舱室导致的强混响以及嘈杂舱室噪声也使传统麦克风阵列算法性能严重下降。考虑船舶舱室复杂环境下小尺寸麦阵DOA估计场景,提出了一种轻量级Mask-DOA估计神经网络模型。该方法在DOA估计神经网络引入Mask算法降低噪声和混响的干扰,并提取增强后的GCC-PHAT作为网络特征,从而在小尺寸麦阵上实现高精度DOA估计。仿真和实验结果表明,所提出的Mask-DOA模型面对复杂的船舶舱室环境更鲁棒,泛化能力更强。
中图分类号:TN912.3
文献标识码:A
DOI:10.16157/j.issn.0258-7998.212108
中文引用格式:刘雨佶,童峰,陈东升,等. 面向船载远程会议的麦克风阵列高精度DOA估计[J].电子技术应用,2022,48(3):32-36,77.
英文引用格式:Liu Yuji,Tong Feng,Chen Dongsheng,et al. High precision DOA estimation of microphone array for shipboard teleconferencing[J]. Application of Electronic Technique,2022,48(3):32-36,77.
High precision DOA estimation of microphone array for shipboard teleconferencing
Liu Yuji1,2,3,Tong Feng1,2,3,Chen Dongsheng1,2,3,Lu Rongfu4,Feng Wanjian4
1.Key Laboratory of Underwater Acoustic Communication and Marine Information Technique of the Ministry of Education, Xiamen University,Xiamen 361002,China; 2.College of Earth and Ocean Sciences,Xiamen University,Xiamen 361002,China; 3.Shenzhen Research Institute of Xiamen University,Shenzhen 518000,China; 4.Xiamen Yilian Network Technology Co.,Ltd.,Xiamen 361000,China
Abstract:With the improvement of ship intelligence level, shipboard teleconferencing system is of great significance to improve the emergency handling capacity and promote the construction of shipboard integrated network. Microphone array is an important voice front-end to ensure the voice effect as well as the multi-mode interaction of teleconferencing system. However, while the small size of ship cabins leads to the adoption of small-size array, strong reverberation caused by small cabins and noisy cabin noise also seriously degrade the performance of traditional microphone array algorithm. Considering the direction of arrival(DOA) estimation scenario of small-size array in complex environment of ship cabin, a lightweight Mask-DOA estimation neural network model is proposed in this paper. With this method, Mask algorithm is introduced into the DOA estimation neural network to reduce the noise and reverb interference, then the enhanced GCC-PHAT is extracted as the network feature, so as to realize the high-precision DOA estimation on the small-size microphone array. Simulation and experimental results show that the Mask-DOA model proposed in this paper is more robust and has better generalization ability in the complex environment of ship cabin.
Key words :direction of arrival estimation;ship cabin noise and reverberation environment;neural network;time-frequency masking

0 引言

船载远程会议系统在船舶智能化方面发挥着显著作用,特别是可提高应急处理能力,推进船岸一体化网络建设。近些年来,船载远程会议监测系统发展迅速[1-3]。麦克风阵列通过提供准确波达方向(Direction Of Arrival,DOA)估计可实现语音增强处理,同时还可以为远程会议系统摄像机提供说话人方位信息,实现多模态交互,已成为远程会议系统的重要语音前端[4-5]

一般远程会议场所较为理想,因此往往采用较大的麦克风阵列以保证DOA估计,提高语音增强性能和多模态交互效果。但是,船载远程会议所在船舶舱室属于非常典型复杂声学场景。一方面,舱室尺寸狭小,既造成严重混响,也导致无法方便容纳尺寸较大的远程会议麦克风阵列;另一方面,受严重船舶舱室噪声干扰[6],包括由各个舱室有限的空间里集中了非常多的电气设备与发动机等设备造成严重的内部噪声,以及其他舰船噪声、海浪等导致的外部噪声。这些都将使得船舶舱室声学特性变得复杂,对麦阵DOA估计提出了更高的挑战。

近些年,随着人工智能的发展,Xiao等人提出利用多层感知机(Multilayer Perceptron,MLP)来进行DOA估计[7],利用深层网络与大数据来提高DOA估计准确率,远远超过传统DOA估计算法。Diaz-Guerra等人利用带相位变换导向响应功率特征作为特征,建立神经网络模将DOA估计任务转化为回归问题[8]。Nguyen等人使用具有多任务学习功能的2D卷积神经网络从短时空间伪谱鲁棒地估计声源的数量和到达方法[9],这种方法减少了神经网络学习声音类别和方向信息之间不必要的关联,加速模型的收敛。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003998




作者信息:

刘雨佶1,2,3,童 峰1,2,3,陈东升1,2,3,卢荣富4,冯万健4

(1.厦门大学 水声通信与海洋信息技术教育部重点实验室,福建 厦门361002;2.厦门大学 海洋与地球学院,福建 厦门361002;

3.厦门大学深圳研究院,广东 深圳518000;4.厦门亿联网络技术股份有限公司,福建 厦门361000)




wd.jpg

此内容为AET网站原创,未经授权禁止转载。
Baidu
map