kaiyun官方注册
您所在的位置: 首页> 其他> 设计应用> 基于匹配层融合的识别算法研究与实现
基于匹配层融合的识别算法研究与实现
2020年电子技术应用第7期
李傲梅,胡正豪,周川川
陆军炮兵防空兵学院 信息工程系,安徽 合肥230031
摘要:提出一种基于音视频匹配层自适应加权融合的身份识别方法。在不同程度的噪声情况下,图像与声音的识别率会随噪声的增强而降低,凭借单个生物模态的识别,难以达到很好的预测结果;而且两种模态融合时的权值不同,融合系统的稳定性效果也不同。采用双模态的自适应加权融合不仅可以有效地弥补不同生物模态识别之间的优缺点,而且可以自适应选择最优的权值进行决策。实验表明,该方法的理论推测成立,比单模态的身份识别具有更高的识别率与鲁棒性。
中图分类号:TN06;TP391.4
文献标识码:A
DOI:10.16157/j.issn.0258-7998.191426
中文引用格式:李傲梅,胡正豪,周川川. 基于匹配层融合的识别算法研究与实现[J].电子技术应用,2020,46(7):57-59.
英文引用格式:Li Aomei,Hu Zhenghao,Zhou Chuanchuan. Research and implementation of recognition algorithm based on matching layer fusion[J]. Application of Electronic Technique,2020,46(7):57-59.
Research and implementation of recognition algorithm based on matching layer fusion
Li Aomei,Hu Zhenghao,Zhou Chuanchuan
Department of Information and Communication Engineering,Army and Artillery Air Defense Force College,Hefei 230031,China
Abstract:This paper proposes an adaptive weighted fusion based on audio-video matching layer.In the case of different degree of noise, the recognition degree of image and sound will decrease with the increase of noise.And the weight of the two modes is different, the stability effect of the fusion system is also different.The adaptive weighted fusion of two modes can not only make up the advantages and disadvantages of different biological modes, but also choose the optimal weight to make the decision.Experiments show that the proposed method is feasible and has higher recognition rate and robustness than single mode identification.
Key words :audio and video fusion;matching layer;adaptive weighting;identification;robustness

0 引言

目前,人工智能迅速崛起,身份识别技术更是应用在生活各个领域之中,如检票、付款、登录系统等。但是日常应用的环境都是在条件较好的情况,并不满足全天候嘈杂的复杂作战环境,如在阴雨天或者夜晚光线不充足时,人脸图像的采集就会受到影响;在战车舱内进行身份识别驾驶时,会因为发动机或炮火声的影响,导致语音信号受噪声干扰。所以,依靠任何一种单模态的身份识别都极易受到外部环境的影响。采用多模态的身份识别技术(如人脸、语音、指纹、虹膜等[1-3]),可以通过对来自多种传感器信号的处理、分析、决策,弥补不同模态信息的不足,降低单一模态受干扰产生的误差,得到更加可靠、准确的结果。

近年来,多模态的融合识别技术备受关注,一般情况下主要分为数据层、特征层、匹配层和决策层融合[4-5]。由于图像属于二维信号,语音属于一维信号,数据层和特征层融合相容性不强,且运算复杂;决策层融合依赖信息匮乏单一,抗噪能力弱。因此,本文主要提出一种针对声纹和人脸特征的匹配层融合识别算法,首先对不同说话人的无噪声语音信号建立高斯混合模型,然后对加入噪声的语音信号进行模型匹配获得匹配分数,再对含有噪声的人脸图像依次进行小波分解、主成分分析(Principal Component Analysis,PCA)降维、支持向量机(Support Vector Machine,SVM)分类获取匹配分数,最后利用本文提出的自适应加权融合算法进行加权匹配分析,获得最优决策结果。本文创新点在于规范一个衡量系统稳定性的标准ξ,并利用这个标准选择最佳的权值进行融合,判断结果。实验结果验证表明,该方法比采用单一模态的识别算法更加有效,具有较高且稳定的识别率。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000002902




作者信息:

李傲梅,胡正豪,周川川

(陆军炮兵防空兵学院 信息工程系,安徽 合肥230031)

此内容为AET网站原创,未经授权禁止转载。
Baidu
map