应对语音交互变革,CEVA“软硬”兼施
2017-09-07
语音是人类最自然而直接的交互方式,如今恰是从“自然”向“智能”时代跨越的过渡期。在智能语音时代,用户只需用说话的方式给服务终端发布命令,就能得到相应的服务。作为人工智能产业链上的关键一环,智能语音已在Siri等数字语音助手、智能家居、车载、可穿戴设备等域中开始落地。
未来,智能语音必将支持多用户体验。比如,不同家庭成员将拥有不同的操作权限,经认证的汽车拥有者借助语音指令,通过智能手表预启动汽车等。
除了语音识别,CEVA公司战略营销总监Moshe Sheier认为语音的魅力不止于此:“我们认为语音识别还将够胜任更多工作,例如,未来语音识别系统将能够通过声音来辨认人(如果在系统中预先注册),了解人们的情绪状态,而且无论不受周围环境影响而畅顺工作。这样语音识别系统才更人性化,能基于所处位置、喜好以及过往活动等来进判断操作。这需要对语音识别进行深度扩展——加入‘声音感测’,除了人声信息还可识别其它声音事件,比如家里的门铃声和玻璃破碎的声音,或者道路上紧急车辆的警笛。语音识别和声音感测的可渗透到生活的每个方面,手机和可穿戴产品的语音激活、智能家居控制、智慧城市安保(声音事件感测),汽车、商业和财务等领域。”
CEVA公司战略营销总监Moshe Sheier
“软硬”兼施的CEVA语音平台 怎样的平台才能称之为适用于语音应用的平台呢?
回答这个问题,首先需要对应用场景进行分类,是电池驱动还是插座式电源供电、是近场交互操作还是远场识别。应对以上不同场景,便需要两种不同的解决方案:
第一种是具有超低功耗的近距离交互,使用1至3个麦克风的始终在线语音助手;
第二种是支持4至8个麦克风的高性能远距离应用,可使用多种前端技术,比如波束成形和多通道回声消除器。
基于此,CEVA提供CEVA-TeakLite-4 超低功耗 DSP平台和CEVA-X2高性能DSP平台解决方案。除了用于语音识别的专用DSP内核,还提供应用软件。Moshe Sheier表示,以上两款方案均有实际应用案例,并包含多个CEVA及合作伙伴的软件包,可实现任何风格的语音助手应用。
如何应对智能语音痛点 尽管技术先行,但智能语音还存在诸多的挑战,最大的挑战便是环境噪声,而往往是多个噪声源错综交织——其他人的交谈、音乐播放、空调器和其它机器噪声、交通噪声等等。因而,获得良好的信噪比尤为关键,通过生成清晰的声音信号来作为语音识别引擎。
应对这些挑战就需要通过降噪、麦克风阵列波束成形、扬声器跟踪、回声消除器、始终聆听唤醒词和嵌入式(非基于云端)语音指令等。
Moshe Sheier表示:“CEVA已向全球多个地区的客户交付超过60亿个音频/语音芯片,可实现麦克风拾音、降噪、回声消除和嵌入式语音指令,并将清晰的语音数据编码发送到云端。我们拥有丰富经验应对语音交互的变革。”