混搭出奇迹,自动驾驶AI芯片上演架构之争
2021-09-23
来源:中国电子报
经历了2016—2019年的野蛮生长期,2019的洗牌期,自动驾驶走入了发展新阶段。谷歌Waymo、百度Apollo、特斯拉、英伟达、Mobileye等行业领先企业技术不断迭代,场景化应用落地加速,为此,《中国电子报》推出“驶向自动驾驶新纪元”系列报道,通过梳理自动驾驶技术升级、厂商布局、产业发展等,描摹自动驾驶产业新面貌。
AI芯片很热,自动驾驶AI芯片更热。英伟达、英特尔、特斯拉、高通、地平线、黑芝麻智能等国内外传统芯片厂、新锐企业纷纷涌入车载AI芯片市场。如今,L2+ADAS自动驾驶商业变现风头正劲,L4高级别自动驾驶落地路线也越来越清晰,毫无疑问,自动驾驶正成为头部芯片企业争相抢占的高地。
从各大厂商的产品路线来看,自动驾驶芯片呈现出GPU、FPGA、ASIC三大架构共荣的格局。然而,底层架构不是判定自动驾驶能力的唯一因素,随着汽车智能化程度的提高,自动驾驶对于软件能力的要求走高,一场“始于硬件”的自动驾驶芯片竞速赛已全面开启。
自动驾驶汽车智能化水平越来越高,需要处理的数据体量越来越大,高精地图、传感器、激光雷达等软硬件设备对计算提出更高要求,具备AI能力的主控芯片成为主流,加速芯片可以提升算力并助推算法的产生。目前,常见的AI加速芯片包括GPU、ASIC、FPGA三类。
盖世汽车研究院高级分析师王显斌向《中国电子报》记者指出,传统车辆普遍使用ECU,底层芯片主要为CPU。自动驾驶对数据传输实时性要求大,仅靠CPU的算力与功能早已不能满足所需,CPU与GPU、FPGA、ASIC等架构结合形成“CPU+XPU”是自动驾驶芯片设计的主流趋势。
目前主流厂商多以“CPU+XPU”相结合的方式,进行自动驾驶芯片设计。英伟达Xavier和特斯拉FSD采用“CPU+GPU+ASIC”的设计路线,Xavier以GPU为计算核心,主要有4个模块:CPU、GPU、Deep Learning Accelerator(DLA)和Programmable Vision Accelerator(PVA),其中GPU占据最大面积;特斯拉FSD以NPU(一种ASIC)为计算核心,有三个主要模块:CPU、GPU和Neural Processing Unit(NPU),其中特斯拉自研的NPU占据最大面积,主要用来运行深度神经网络,GPU主要是用来运行deep neural network的post processing部分。
Mobieye EyeQ5和地平线征程系列采用“CPU+ASIC”架构,EyeQ5主要有4个模块:CPU、Computer Vision Processors(CVP)、Deep Learning Accelerator(DLA)和Multithreaded Accelerator(MA)。其中CVP是针对很多传统计算机视觉算法设计的ASIC;地平线自主设计研发了Al专用的ASIC芯片Brain Processing Unit(BPU)。
Waymo采用“CPU+FPGA”,计算平台采用英特尔Xeon12核以上CPU,搭配Altera的Arria系列FPGA。
三大架构竞速高级别自动驾驶
“GPU擅长图像识别,ASIC、FPGA可以灵活设计,满足定制化需求。”王显斌向《中国电子报》记者表示。
自动驾驶要具备高精度、高可靠性的图像识别能力,GPU的设计初衷是为了应对图像处理中需要的大规模并行计算,刚好契合自动驾驶的关键技术要求。英伟达在GPU领域拥有长期积累的技术和市场,进入自动驾驶赛道后,携其GPU迅速占领市场,合作伙伴囊括奔驰、沃尔沃、现代、奥迪、上汽等传统车厂,蔚来、理想、小鹏这些造车新势力也在使用英伟达的自动驾驶芯片。
今年8月,英伟达推出最新自动驾驶芯片组——DRIVE Atlan。据介绍,Atlan单颗芯片的算力能够达到1000 TOPS,将应用于L4及L5级别自动驾驶。英伟达CEO黄仁勋公开表示,Atlan SoC将于2023年向开发者提供样品,2025年大量装车。王显斌指出,未来自动驾驶芯片会出现更多多元化架构GPU,高精地图、传感器、激光雷达等对图像识别能力要求越来越高,GPU的需求量会越来越大。
特斯拉采用了与英伟达相似的设计路线,不过更加侧重于ASIC。今年8月,马斯克在2021年特斯拉AI Day上,向外界展示了一款自研芯片云端Dojo。Dojo的训练CPU属于ASIC芯片,专注于人工智能训练,可以实现1024 GFLOPS的BF16算力。特斯拉表示,它的效率超过了现有的GPU和TPU,可以大幅度优化算法提升的效率,为L4、L5级别的自动驾驶做铺垫。特斯拉Dojo在云端模拟了一个十分贴近现实的世界,用来训练自动辅助驾驶技术。
马斯克一直认为,解决自动驾驶的唯一方法是解决现实世界中的AI问题,无论是硬件还是软件,除非一家公司具有很强的AI能力以及超强算力,否则很难解决自动驾驶难题。Dojo正是基于对自动驾驶问题的考量。特斯拉选择ASIC的原因也不难理解,为各行各业提供通用能力的方案并不是特斯拉想要的,而ASIC的优势在于灵活设计,能够更好地满足产品的定制化需求。
Waymo可以说是属于FPGA派系的。2017年,英特尔宣布,自2009年开始便一直在与谷歌合作开发无人驾驶汽车,同时也为谷歌母公司Alphabet旗下自动驾驶公司Waymo提供Xeon处理器、Arria系统芯片(用于机器视觉)。Arria属于FPGA芯片,不过Waymo在芯片方面相对低调,没有曝光太多细节。值得注意的是,2015年英特尔收购了主打ASIC的芯片厂商Altera;2017年收购了Mobileye,MobileyeEye系列自动驾驶芯片是典型的ASIC技术路线的代表。
英伟达、特斯拉新品双双对准了L4、L5级别自动驾驶,Waymo从入局就定位在高端,头部厂商已形成围绕高级别自动驾驶升级产品的态势。
作者丨张一迪
编辑丨连晓东
美编丨马利亚