骁龙855在AI性能上真的秒杀麒麟980
2018-12-24
前段时间的高通发布会上,有关骁龙855AI性能达到友商竞品两倍的言论可谓是赚足了眼球。高通指出,骁龙855针对CPU、GPU、DSP都进行了AI计算优化,结合第四代AI引擎可以实现每秒超过7万亿次运算(7 TOPs)的AI算力。
高通在发布会上指的“友商”,特意点名是安卓平台另一款使用7nm工艺的处理器,目前三星最新的处理器Exynos 9820是基于8nm工艺打造,苹果A12芯片虽然使用了7nm工艺,但平台不同很难比较。言下之意,这里的“友商”很明显就是指的华为的最新处理器麒麟980。
说到手机芯片的AI性能,麒麟980主要依靠独立内置的NPU来支撑,这颗NPU就是AI芯片创企寒武纪开发的1H处理器。而就在12月13日于清华大学举办的嵌入式人工智能大会上,寒武纪创始人兼CEO陈天石在演讲中提到:“前段时间高通发布骁龙855时宣称,其AI性能是友商竞品的2倍,我不知道这是不是在指我们,如果是,我不认为1H的AI性能会落后于骁龙855。”陈天石还表示,“在我们内部测试中,1H的测试结果非常优秀,测试峰值非常的高。如果高通有信心地话不妨公布测试结果,比一个高下。”
显然,火药味很浓。
难道,没有搭载独立的NPU内核的骁龙855真的比搭载寒武纪1H处理器的麒麟980芯片在AI性能上强两倍吗?最近,这一话题在知乎上也得到了一些从业者的关注和讨论。智能菌整理如下:
知乎作者麦克阿摄认为:从7万亿这个数字来看,骁龙855是横扫苹果的A12和华为麒麟980的(根据970的数据,算上980的增幅,可得麒麟980的算力为4.2TOPs)。
但从AIMark平台上的跑分成绩来看,高通855平台获得2.2万分,和麒麟980的得分2.15万分相差不大,这又是怎么一回事呢?
原来,高通得出这个所谓的7 TOPS算力,是基于CPU+GPU+DSP这三部分的总计所得。但不管是华为还是苹果,给出的AI算力数据都是来源于其单独的NPU。
需要科普的是,CPU非常适合逻辑运算和整数运算,也可以进行浮点运算,但其效率低并且功耗高。随着技术和应用的发展,单单CPU已经难以满足是来自图形渲染的需求了,于是专门进行浮点运算的GPU应运而生,它大大提升了浮点运算的效率,降低了功耗。而AI主要是做卷积运算,需要超大量的浮点运算来支撑,但这里的浮点运算并不需要GPU提供那么高的精度,只需要更低精度的浮点运算就完全胜任,而这正是NPU所最擅长的领域。另外,高通的发布会中也特别强调了DSP的设计,但这毕竟也不是什么新概念。从硬件角度来说,可能有所提升,但也绝不具备NPU在AI计算上的专业和高效率。
知乎用户养猫的哈士奇认为:衡量AI性能没有统一的标准,有很多都指标,有的跑卷积、有的跑池化、有的跑浮点、还有跑挖矿的,这里的指标最重要的应该是卷积。
本着“大胆假设,小心求证”的思路,拜托一位搞AI研发的朋友跑了一下卷积运算。测试机型是搭载骁龙845的小米MIX 2S和搭载A12芯片的iPhone XS。如果按照高通的说法,骁龙855的AI性能是845的三倍。
结果显示,在基于AI神经网络实测的场景下,搭载骁龙845的小米MIX 2S测试数据为10.39,而搭载苹果A12芯片的iPhone XS测试数据为72.64,测试数据越高代表AI性能越强。如果骁龙855的AI性能是845的三倍,那么测试数据应该是31.17,这一数字远低于A12的72.64,但是苹果A12芯片对外公布的AI算力只有5 TOPS。是不是很奇怪?
那么,高通骁龙855所公布的7 TOPS是怎么得来的?
骁龙855公布的AI性能是通过CPU+GPU+DSP的方式来实现的,如果是这样这个数字基本没意义。因为在移动端能耗比是非常重要的指标,更何况CPU、GPU、DSP还有其它任务不能全力投入AI运算,高通骁龙855的在AI运算上的能耗比太低了。
以上知乎作者都认为,高通宣称的骁龙855可以达到7 TOPS算力完全是用来吹牛逼的。
但从另外一个角度看,不管是华为麒麟980还是高通骁龙855,以现有的应用来看,其AI性能都是大量过剩的。因为手机中所谓的AI只是一个执行加速器,并不会用来进行训练,现在的性能根本用不完,很多厂家在这方面都制造了足够的噱头。(来源:网易科技)