语音伪装方法及其防御对策综述-AET-电子技术应用

语音伪装方法及其防御对策综述

《信息技术与网络安全》2020年第8期

郑琳琳1，孙蒙1，张雄伟1，潘志欣2

1.陆军工程大学，江苏南京210007；2.海军工程大学，湖北武汉430000

摘要：语音伪装是指以隐藏说话人身份为目的对说话人的个性特征进行的改变。近年来，随着智能语音交互技术和声纹认证产品的快速发展，语音伪装被应用到语音产品隐私保护中，但是也被不法分子用以实施违法犯罪行为。因此，语音伪装成为目前语音处理和信息安全领域非常有实用意义的研究问题。在简要介绍语音伪装的典型模型和方法的基础上，梳理了语音伪装威胁量化评估方案，总结了近几年伪装语音的防御对策，分析了目前防御对策中存在的问题及技术难点，并对语音伪装的未来研究发展方向进行了展望。

关键词： 语音伪装声纹识别自动说话人确认语音变换

中图分类号：TN912
文献标识码：A
DOI：10.19358/j.issn.2096-5133.2020.08.007
引用格式：郑琳琳，孙蒙，张雄伟，等. 语音伪装方法及其防御对策综述[J].信息技术与网络安全，2020，39(8)：33-42.

Voice disguise and its countermeasures for anti-disguise

Zheng Linlin1，Sun Meng1，Zhang Xiongwei1，Pan Zhixin2

1.Army Engineering University of PLA，Nanjing 210007，China； 2.Naval University of Engineering，Wuhan 430000，China

Abstract：Voice disguise refers to the change of the personality characteristics of the speaker for the purpose of hiding the speaker′s identity. In recent years, with the rapid development of intelligent voice interaction technology and voiceprint authentication products, voice disguise has been applied to the privacy protection of voice products, but it has also been used by criminals to commit illegal crimes. Therefore, voice disguise has become a very practical research issue in the field of voice processing and information security. On the basis of introducing the typical models and methods of voice disguise, the methods of quantifying voice disguise threat assessment methods are summarized in this paper, and the defense countermeasures of disguise voice in recent years are introduced. Then, the problems and technical difficulties still existing in defense countermeasures are analyzed. Finally, the prospects for the research development direction of voice disguise are given.

Key words :voice disguise；speaker recognition；automatic speaker verification；voice transformation

语音是人们日常交流中的一种最直接、最有效和最常用的传递信息方式。由于说话人发音器官的生理差异和后天成长环境形成的行为差异，每个人的语音都带有强烈的个性特征，能够像虹膜、指纹、人脸等生物认证技术一样，成为身份验证的重要手段，称为声纹识别技术。声纹技术因其具有经济、可靠、交互自然等优势而备受关注，具有重要研究意义和广泛应用前景。

虽然每个说话人的语音有自己的个性特征，但是语音也是可以被模仿和伪装的。目前，市面上流行的各类变声器及变声软件可以对说话人的语音进行个性化改变，致使人耳甚至部分声纹识别技术产品很难识别出说话人的身份。犯罪分子利用特定手段来伪装自己的语音不被辨识出来，实施电话诈骗、恐吓、绑架勒索等相关新闻报道也是数见不鲜。军事上，某些组织成员通过使用全新的电话号码和语音伪装的方式来逃脱政府监控的识别。随着智能语音交互技术被广泛应用到商业活动和军事应用中，人们对信息安全的要求也越来越高。然而，语音伪装严重影响声纹识别效果，使犯罪分子有机可乘。

语音伪装(Voice Disguise)是指对于正常语音的任何改变、扭曲或者偏离。它涵盖了故意伪装和非故意伪装两种形式。网络空间安全领域更多关注的是故意伪装，即“以掩盖真实身份为目的，有意识地改变声音，使其模糊、畸变、扭曲的发音方式”。伪装语音的相关研究工作最早可追溯至20世纪六十年代初期的法庭说话人辨认，至今已有50多年的研究历史。近年来，语音信号处理和互联网技术的进步，以及语音数据获取和共享的更加便捷，有力地推动了语音伪装技术的发展。特别是基于机器学习和深度学习的语音合成技术能够生成特定说话人的语音样本，对声纹识别接口的用户构成了严重的隐私威胁。因此，语音伪装受到学术界和产业界的广泛关注，诸多国内外学者开展了与语音伪装相关的研究。日本东京国立资讯研究所、法国国家信息与自动化研究所以及美国伊利诺理工大学等开展了语音伪装方式的研究，进一步提高了伪装语音的匿名化程度；中国刑警学院和多地公安部门针对伪装语音变声规律及其对自动说话人确认系统(Automatic Speaker Verification，ASV)的影响展开了相关工作；清华大学、南京邮电大学以及中山大学等在伪装语音防御对策方面做了相关研究，并相继取得了一些研究成果。

本文在简要梳理语音伪装的典型模型和基本方法的基础上，介绍了语音伪装的威胁量化评估方法，归纳了语音伪装的防御对策，并总结了目前语音伪装防御对策研究中仍存在的问题和挑战，对未来的发展方向作出了展望。

本文详细内容请下载：http://www.chinaaet.com/resource/share/2000003244

作者信息：

郑琳琳1，孙蒙1，张雄伟1，潘志欣2

(1.陆军工程大学，江苏南京210007；2.海军工程大学，湖北武汉430000)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容