kaiyun官方注册
您所在的位置: 首页> 通信与网络> 业界动态> 向“沟通”AI应用发起跨越冲刺,这项技术有何难点?

向“沟通”AI应用发起跨越冲刺,这项技术有何难点?

2019-05-16
关键词: UNIT3.0 百度大脑 AI

  我们对于AI应用的追逐过程如同跨栏,此时此刻回头看看,会发现“计算”、“感知”和“决策”这些横栏,都已经在我们身后。如今我们已经可以熟练的用语音识别和图像识别来感知信息,再通过机器学习对海量数据的处理来给出结论。

  如果问下一道横在我们面前有待跨越的横栏是什么,想必就是意味着“沟通”的智能对话技术了。

  横栏在前:

  智能对话技术跨越的前一秒

  建立在语音识别和语音生成等的NLP技术上,人机对话之间的简单对话已经非常普及,像是通过语音唤醒某一项设备或功能,或是和智能助手进行一些单轮问询。但想要系统化地普及智能对话技术,实现人机之间流畅的理解和多轮对话,恐怕还有着不少限制。而这种限制,已经到了亟待跨越的时候。

  第一, 缺乏灵活的自然语言交互对话,我们在进行人机操作时依然需要依赖按键、屏幕等等设备,对于AI技术的应用场景有着很多桎梏。

  第二, 在无法进行智能对话的前提之下,很多需要频繁沟通的工作,依然无法被AI代劳,即使AI已经远超人类的记忆存储、计算决策和感知能力。

  举例来说,在车载、智能音箱、客服和机器人这四大领域中,智能对话技术应用的便利与否,就与其体验息息相关。在车载场景中,人们无暇用手与眼与AI进行交互,必然要依赖灵活精准的对话系统。至于智能音箱这类硬件,智能对话不仅限制其产品形态,也会影响其服务能力。智能客服与机器人更不必说,对于这种以交互为主的产品,能否拥有自然的智能对话技术,实则是根深立命之本。

  从市场表现上,我们也能发现智能对话正在进入工业级应用爆发的潜伏期。

  目前来说,一项技术爆发所需要的四个因素:技术高度、生态广度、用户取向和企业需求,在智能对话领域已经尽数铺垫完成。

5cdcab60755ad-thumb.jpg

  像自然语言处理、语音技术以及知识图谱等技术已经储备完善。数据显示,在行业应用中38%的企业已正在应用基于智能对话的系统、麦克风阵列等上下游硬件解决方案,也在智能硬件市场的成长中达到一定积累,行业生态覆盖正在加速。数据显示,2019年Q1中国智能音箱销量同比增长9倍,移动终端、车载系统、智能硬件等产品中引入对话交互的现象也日益普及,毫无疑问,用户无比渴望更便利的交互方式。最后,在人力成本日益提高时,企业对于智能对话的需求也越来越旺盛,据与IDC联合调研,有83.3%企业认为智能对话能有效降低运营成本。

  在今天,百度举办了百度大脑智能对话引擎及产品发布会,宣布了百度大脑智能对话定制平台UNIT3.0的全新升级,并展示了智能对话生态全景。

  就此,我们或许可以确定,人类终于向“沟通”这一AI应用的横栏发起了跨越冲刺。

  复合型技术的迷墙

  如果将百度大脑看做智能对话技术应用的第一个跨越者,我们也可以从中倒推出这项技术应用的难点在哪里。

  一般来说,某一项技术工业级应用的突破要取决于成本效率比、人才储备、配套服务和概念认知之上。

  智能对话的特殊之处在于,这项技术的复合性极强,包含了语音识别、语音生成、语音语义一体化、知识图谱构建等等一系列技术。这就意味着这项技术的成本必然相对偏高、人才储备也多半集中在技术企业和科技巨头之中。

5cdcab607484f-thumb.jpg

  而智能对话技术所应用的场景又相对复杂,交互本身无处不在,智能对话技术既可以向智能客服这里软件服务领域输出,又可以投入于智能耳机、智能音箱这类硬件领域。更有很多全新的应用空间亟待开发。配套服务的普及,一定是一条相对艰难的道路。

  综合下来,会导致智能对话技术距离应用场景间隔了一道迷墙,注定了很多企业对这项技术的认知理解有所偏差,认为这项技术还并不适合自己的企业应用。

  这就是为什么,率先动身跨越横栏的人,会是百度。

  发起冲刺:

UNIT 3.0和语音技术平台正在蓄力

  在百度大脑的智能对话生态中,为整个产业开放了两个重要产品平台。

  第一是为开发者提供专业对话系统定制技术的UNIT 3.0。

  基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的AI技术,百度大脑推出的UNIT3.0版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级,其中为开发者提供了很多预置能力,例如有关天气、闲聊、定会议室的对话技能,还有大幅提升样本生产和标注效率的DataKit和一系列知识库。

  建立在这种模块化的组件模式上,开发者定制对话系统就会变得像拼乐高一样简单,而非是过去那样,在一团杂乱的毛线中寻找线头。如此以来,将极大地降低开发成本和时间成本,极大地提升效率与性价比。

5cdcab6018a04-thumb.jpg

  第二个产品平台,是包含了领域语音方案和语音自训练平台的语音技术平台。

  相比更倾向于赋能开发者的UNIT 3.0,语音技术平台则进一步为企业客户提供了更易上手的工具。

  在领域语音方案中,我们可以看到百度大脑推出了他们擅长的端到端一体化解决方案。这次发布会中所展示的呼叫中心语音解决方案,就是一个很好的案例,通过针对于呼叫中心场景优化过专属语音识别模型,结合呼叫中心场景专属8K音库,可以在识别和生成两端进行优化。对于那些适用于呼叫中心场景的企业用户来说,其便利程度接近于即拿即用。

  语音自训练平台,则和EasyDL等自动化机器学习平台类似,通过从基础语音模型到行业语音模型再到个性化语音模型的层层训练,最终提升针对于场景业务的语音识别率。而这一整个过程都是自助式的,不需要代码基础。这也自然解决了企业人才匮乏的致命问题。

  这两项产品如同百度大脑智能对话生态的左右腿,甩掉了成本、效率和人才的桎梏,直接向智能对话的工业级应用发起冲刺。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306116;邮箱:aet@chinaaet.com。
Baidu
map