英特尔在Movidius Myriad X VPU中推出片上神经网络计算引擎
2017-08-29
昨日,英特尔推出了新的Movidius? Myriad? X视觉处理单元(VPU),进一步完善了英特尔的端到端人工智能产品组合,为无人机、机器人、智能摄像头和虚拟现实等各种产品提供更多自主功能。
Myriad X是全球第一个配备专用神经网络计算引擎的片上系统芯片(SoC),用于加速端的深度学习推理。该神经网络计算引擎是芯片上集成的硬件模块,专为高速、低功耗且不牺牲精确度地运行基于深度学习的神经网络而设计,让设备能够实时地看到、理解和响应周围环境。引入该神经计算引擎之后,Myriad X架构能够为基于深度学习的神经网络推理提供1 TOPS [1] 的计算性能。
英特尔新技术事业部副总裁兼Movidius部门总经理Remi El-Ouazzane表示:“计算机视觉和深度学习正在成为我们日常生活中的数十亿设备的标配。让设备具备类似于人类的视觉与智能,是计算领域的下一波重大进步。通过Myriad X,我们正在重新定义VPU对于提供尽可能多的人工智能和视觉计算能力的意义,满足现代无线设备对功耗和散热的独特要求。”
Myriad X可以提供超过4 TOPS [2] 的总体性能表现,其微型的尺寸和板载处理能力非常适合自主设备解决方案。除了神经计算引擎,Myriad X通过如下方式独特地实时整合了成像、视觉处理和深度学习推理:
◎ 可编程128位VLIW向量处理器:通过为计算机视觉工作负载而优化的16个向量处理器可以灵活地同时运行多个成像和视觉应用流水线。
◎ 增加可配置的MIPI通道:通过其一套丰富的接口和16个MIPI通道,可以把多达8个高清RGB摄像头直接连接到Myriad X,从而支持最高每秒7亿像素的图像信号处理吞吐量。
◎ 强化的视觉加速器:利用超过20个硬件加速器来执行光流和立体深度等任务,而不需要额外的计算开销。
◎ 2.5 MB的多核异构同质片上内存:集中化的芯片内存架构最高支持每秒450 GBytes的内部带宽,通过尽量减少芯片外部数据传输进而最小化数据访问的延迟并降低功耗。
Myriad X是最新一代Movidius VPU,专为嵌入式视觉智能和推理开发设计。Movidius VPUs通过整合三种架构能够在低功耗的情况下实现高性能,从而为深度学习和计算机视觉工作负载提供持续的高性能:
(1)一组可编程VLIW向量处理器,其中的指令集为计算机视觉和深度学习工作负荷进行了优化;
(2)一套硬件加速器可以支持图像信号处理、计算机视觉和深度学习推理;
(3)通用的智能内存结构,用于把芯片上的数据搬移量降至最低。
[1] 每秒万亿次操作(TOPS)。最高性能是基于神经计算引擎的峰值浮点计算吞吐量。
[2] 架构计算是基于所有计算单元上的最大每秒操作次数性能。