文献标识码:A
DOI:10.19358/j.issn.2096-5133.2020.08.007
引用格式: 郑琳琳,孙蒙,张雄伟,等. 语音伪装方法及其防御对策综述[J].信息技术与网络安全,2020,39(8):33-42.
语音是人们日常交流中的一种最直接、最有效和最常用的传递信息方式。由于说话人发音器官的生理差异和后天成长环境形成的行为差异,每个人的语音都带有强烈的个性特征,能够像虹膜、指纹、人脸等生物认证技术一样,成为身份验证的重要手段,称为声纹识别技术。声纹技术因其具有经济、可靠、交互自然等优势而备受关注,具有重要研究意义和广泛应用前景。
虽然每个说话人的语音有自己的个性特征,但是语音也是可以被模仿和伪装的。目前,市面上流行的各类变声器及变声软件可以对说话人的语音进行个性化改变,致使人耳甚至部分声纹识别技术产品很难识别出说话人的身份。犯罪分子利用特定手段来伪装自己的语音不被辨识出来,实施电话诈骗、恐吓、绑架勒索等相关新闻报道也是数见不鲜。军事上,某些组织成员通过使用全新的电话号码和语音伪装的方式来逃脱政府监控的识别。随着智能语音交互技术被广泛应用到商业活动和军事应用中,人们对信息安全的要求也越来越高。然而,语音伪装严重影响声纹识别效果,使犯罪分子有机可乘。
语音伪装(Voice Disguise)是指对于正常语音的任何改变、扭曲或者偏离。它涵盖了故意伪装和非故意伪装两种形式。网络空间安全领域更多关注的是故意伪装,即“以掩盖真实身份为目的,有意识地改变声音,使其模糊、畸变、扭曲的发音方式”。伪装语音的相关研究工作最早可追溯至20世纪六十年代初期的法庭说话人辨认,至今已有50多年的研究历史。近年来,语音信号处理和互联网技术的进步,以及语音数据获取和共享的更加便捷,有力地推动了语音伪装技术的发展。特别是基于机器学习和深度学习的语音合成技术能够生成特定说话人的语音样本,对声纹识别接口的用户构成了严重的隐私威胁。因此,语音伪装受到学术界和产业界的广泛关注,诸多国内外学者开展了与语音伪装相关的研究。日本东京国立资讯研究所、法国国家信息与自动化研究所以及美国伊利诺理工大学等开展了语音伪装方式的研究,进一步提高了伪装语音的匿名化程度;中国刑警学院和多地公安部门针对伪装语音变声规律及其对自动说话人确认系统(Automatic Speaker Verification,ASV)的影响展开了相关工作;清华大学、南京邮电大学以及中山大学等在伪装语音防御对策方面做了相关研究,并相继取得了一些研究成果。
本文在简要梳理语音伪装的典型模型和基本方法的基础上,介绍了语音伪装的威胁量化评估方法,归纳了语音伪装的防御对策,并总结了目前语音伪装防御对策研究中仍存在的问题和挑战,对未来的发展方向作出了展望。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003244
作者信息:
郑琳琳1,孙 蒙1,张雄伟1,潘志欣2
(1.陆军工程大学,江苏 南京210007;2.海军工程大学,湖北 武汉430000)