Intel评价苹果M1:没你们想象中那么好,不信来看数据...
2021-03-11
来源: 电子工程专辑
PC处理器——尤其笔记本处理器这几年的竞争特别有意思。从2017年AMD的初代Zen架构发布之日起,PC处理器性能持续飞跃至今。同年Intel将移动版八代酷睿处理器的核心数目翻倍。移动版十代酷睿的微架构、制造工艺双双升级,IPC实现18%的大跨越。十一代酷睿的核显性能再上新台阶。今年下半年的十二代酷睿眼见着就要上大小核“混合”架构了。从没见Intel这么努力过。但即便如此,Intel暂时也没能在竞争中占到什么便宜。
新冠病毒全球范围肆虐,成为PC行业竞争的催化剂。苹果去年发布M1芯片,更为这场战役开辟了新战场。M1版MacBook笔记本问世以后,风评受害的大概就是Intel了。我们此前也从微架构、底层性能跑分的角度,仔细探讨过Intel如今的CPU,相比苹果M1如何。
昨天Intel召开了一场线上分享会,特别针对苹果M1芯片做了回应和反击。虽说这个时间点的回应感觉有些晚。而且在大约1个月前,我们已经从国外媒体看到了其中的部分PPT。不过这次Intel中国团队又新加了一些内容,我们一并来仔细看一看。趁此机会,也花些篇幅来谈谈Intel十一代酷睿Tiger Lake移动平台,作为本文的选读内容。
苹果M1最初的宣传
苹果芯片做得好,不如苹果广告好(误…去年M1芯片及新版MacBook产品问世时,苹果在发布会上有一些比较嚣张的宣传数据。比如说CPU速度“最高提升至3.5倍”,“性能功耗比提升至3倍”,GPU“图形处理速度最高提升至5倍” ,还有各种没有刻度的图表。这些数字在摩尔定律放缓的今天,显得十分惊悚。
不过如果细看对比详情,就不难发现这些数字存在夸张成分。首先是对比对象,苹果对比的是上一代MacBook产品。比如3.5倍提升,比较的是M1芯片与Intel的八代酷睿处理器,而且对比方法是用Final Cut Pro,将一段4K ProRes RAW视频转码为ProRes 422,速度提升至3.5倍。这其实算是有失偏颇的一个测试。
还有一些对比项是比较令人哭笑不得的,比如说苹果宣称M1的GPU图形算力相比Intel处理器高出5倍,其中一个测试项目是用Final Cut Pro进行3D字幕渲染,速度快“5.9倍”,实在是有够偏门。
当然我们不能就此否认,M1的确是一颗优秀的芯片。而且苹果的各种测试方法,体现了从实际体验角度做考察的基本思路,虽然某些测试项不能反映“日常使用”情况,且对比对象略有误导市场的嫌疑。而Intel的反击也是理所应当的。
Intel眼中的M1:性能也一般
与苹果达成一致的是,Intel昨天对此的回应似乎也认为,单纯的跑分没有太大意义。真正应当看的是终端设备的实际使用体验。这两者的重要差别在于,实际使用体验更看重的是“整个系统”,而不只是CPU核心本身。这个系统可能包括了CPU、图形计算、存储、散热、系统设计、软件(包括操作系统、中间件)等等。
OEM厂商对于芯片的具体系统实施,对面向用户的最终设备使用体验,也起到至关重要的作用。一个典型的例子是在Geekbench 5测试中,Intel十一代酷睿(Core i7-1185G7)的单核性能比苹果M1落后了大约15%;但在Cinebench R23测试里,前者单核性能却是稍强于后者的——虽然十一代酷睿CPU频率比M1高出不少。这种更偏底层的跑分,就使用层面并不具有太大的参考价值。
所以最终落实到整个系统的实际使用体验上,对用户而言还是更靠谱的。不谈频率、微架构、工艺等问题,而谈呈现在用户面前的实际效果。那么我们就来看看,Intel的反击是否靠谱。
Intel把测试分成三大部分,分别是生产力、内容创作、游戏。这三者的确能够反映PC实际使用场景。不过Intel并没有提参与性能测试的十一代酷睿处理器PC具体是哪一款,猜测可能是Intel自己的参考设计(算是笔记本版的NUC)。Linus Tech Tips前不久测试过一款基于Intel参考设计的本子,其性能发挥会优于不少OEM厂商的设计。
性能测试部分,对比的是苹果M1(M1版MacBook Pro,16GB RAM)和十一代酷睿i7-1185G7(16GB RAM,LPDDR4x-4266)。参测双方的操作系统各自为macOS和Windows 。考虑到操作系统及软件、中间层,这其中的变量其实还是相当多的。Intel也在分享会上表示“我们找不到真正可以apple to apple的对比设备,只能尽可能做到相近。”
(1)首先来看“生产力性能”:
这里包含两组数据,是双方在Chrome浏览器下的WebXPRT 3,以及微软Office 365。这两者在M1版的macOS中,已经有了原生支持的软件。(微软和谷歌不愧为苹果的最佳开发者…)
WebXPRT 3这个测试的实际意义在于我们日常在PC之上,越来越多的时间是对着浏览器的。所以这项测试具有代表意义。WebXPRT 3综合得分,十一代酷睿整体比M1高出30%+。Intel在这里列了一些子项,比如照片后期加强、加密笔记与文字识别、线上家庭作业等。其中照片加强,十一代酷睿有近3倍的领先。
再次强调,Intel公布的这些数据反映的是系统性能,而非单纯的CPU性能。这组数据表明Intel笔记本用来跑web任务,表现仍然相当好。
上图的右边部分,是办公软件Office,对比项目包括PPT转PDF、Excel表格计算等。这几个项目也没什么好说的,即便这几项可能是Intel仔细挑选过后的呈现,也还是具有代表意义的。
(2)第二组测试是“内容创作”,如上图。这组对比分成5部分:Handbrake、Topaz Labs、Premiere、Photoshop、Lightroom。做过设计、视频等工作的小伙伴应该对其中的至少2项会比较熟悉。不过这组测试有几个槽点。
Handbrake测试部分,以硬件加速的方式将4K AVC(H.264)格式转为HEVC(H.265),十一代酷睿速度领先12%。这一项其实是十一代酷睿Xe媒体编解码的加强项。但从既有的更多Handbrake测试来看,十一代酷睿占不到太多便宜,这一点我在此前的文章中已经提过;M1的多媒体编解码是其绝对强项,而且Handbrake正在对M1做进一步优化。
反映AI inference能力的Topaz Labs测试,从Intel公布的这组数据来看,十一代酷睿的领先达到了6倍。这两个测试项分别是照片AI降噪,以及将照片尺寸AI放大。这组数据本身没问题,十代酷睿其实就已经注重于AI机器学习性能的加强。
不过需要指出的是,Topaz Labs算是x86开发生态中,目前为数不多充分利用Intel的AI硬件加速优势的应用。这种对比也并不应当过多置喙,因为市面上现有M1与十一代酷睿的对比,很多测试项都是特别针对M1的专用单元做了优化的。这一点考验的还是生态构建能力。
而上图中间三项Premiere Pro测试其实略有些诡异。我们知道Premiere是知名的视频编辑软件。macOS平台M1原生版本Premiere事实上现在还是beta版本(Adobe的超慢速特色)。另外,其中测试项,4K H.264采用的是硬件加速输出,但4K H.265测试项用的却是软件(SW)输出。
事实上,M1的重要优势是表现在H.265性能上的。不过十一代酷睿的Xe媒体引擎加强的重要组成部分,也在于HEVC内容编码支持上。很多vlogger诟病Intel版本的Mac做视频后期不给力,实则在十一代酷睿上应该有质的提升。所以这一项对比大概还有探讨的余地。
上图中的Photoshop对比项其实也不算科学,这张PPT下面的小字标注了,目前M1原生的beta版Photoshop并不支持Content Aware Fill。Lightroom Classic则并非M1原生版本,所以这里的Lightroom是跑在Rosetta转译器下的,对比意义也不大。Adobe全家桶测试体现的主要还是生态构建差异。毕竟Intel的生态存在了这么多年,M1生态的成熟则尚需时日。
(3)“游戏”性能部分的对比,没什么特别值得一说的。游戏一直都不是Mac的强项,M1也无法在短期内扭转这一状况。Intel列出的包括《古墓丽影》《全面战争:三国》《杀手》等游戏都是比较具有代表性的了。这几款游戏在双方的平台上互有胜负,这一点和操作系统、图形API、驱动也有相当大的关系,而远不只与芯片相关。有关Xe核显详情,参见本文的选读部分。
更多游戏在Mac平台上其实是跑不了的。Intel在这一点上,仍是欺负macOS生态本身的不健全,以及引入M1后失去Windows支持(不再支持Bootcamp)。不过M1版macOS当前的生态建设速度也算是肉眼可见的迅速了。
(4)最后,笔记本续航是x86阵营目前的一个短板。Arm阵营流行的大小核设计对于设备闲时与低负载状态下的省电,是多有裨益的。这也是我们期待十二代酷睿快点儿到来的原因。
不过Intel还是多加了“真实续航测试”,并且吐槽了苹果官方的测试方法。比如说苹果宣称MacBook Air续航的15-18个小时,是基于屏幕亮度125nit(在MacBook Air上,按亮度+按键8下,达到的亮度),这个亮度日常大概是没人在用的。
所以Intel采用统一250nit亮度,对比了MacBook Air和Acer Swift 5(酷睿i7-1165G7)。两台设备同时用浏览器播放Netflix视频,外加开了多个网页。测试结果是,两台设备的续航成绩差不多。
这个测试的场景还是具有代表性的。但这个测试的问题在于变量过多,比如说Acer Swfit 5这台笔记本的屏幕分辨率(1080p)比MacBook Air低,屏幕本身成为影响续航一个较大变量;另外这里的对比对象没有选择MacBook Pro,而是电池容量更小的Air;因此处理器在其中的功耗构成,可能被各种变量稀释。另外,M1的优势还在于闲时功耗,这个测试是体现不出来的(虽然苹果本身的测试的确也很不科学)。
Intel眼中的M1:I/O、生态缺失
上面这些可能是技术爱好者们最关心的。无论上述测试项是否有失偏颇,其中的一些项目至少能够表明十一代酷睿在日常使用上相比M1,并不会有类似Geekbench这类跑分表现出的差距。或者说Windows PC也并不像苹果形容得那么不堪。(以及无论如何也没有苹果公布的数据那么失偏颇)
而在性能之外,还有一些值得说道的部分,包括I/O、外设扩展、软件生态、配置多样性等等。这些本质上都属于Intel长久以来的积累。比如说I/O:雷电口就是Intel主导开发的。十一代酷睿在Xe显示引擎部分的重要加强在于,可扩展4条4K显示管线,基于雷电4的十一代酷睿笔记本普遍支持外接多个显示屏——这对于生产力本身就是一种提升。而M1版MacBook正常使用确实只能外接1个显示器,这让MacBook Pro显得很不Pro。
至于生产力、游戏等使用场景下可能涉及的外设(如手柄、画板、外置GPU等),目前都是M1版MacBook的软肋(或者说,可能是macOS长久以来固有的软肋?)。
在严肃的生产力环境中,如工业级别的音乐创作、视频制作等,可能涉及到某个插件不兼容,即导致整个生态不可用的情况。这些都是M1诞生之初面临的一些尴尬,且确确实实存在的问题。
Intel还发现了M1版MacBook在实际使用中可能遭遇的问题。比如说Adobe Acrobat软件在最大化过程里存在延迟卡顿的情况;西数的app无法识别西数硬盘;Final Cut Pro中播放4轨H.264 4K 30fps视频就会出现明显的卡顿和掉帧;玩《全面战争:三国》会出现帧率的严重抖动,而且有不少渲染错误。
不过这些其实都是生态构建早期的小问题。最终总结一句话,还是生态构建是否到位的问题。(似大有拉上了微软的意思,Windows 10 on Arm貌似更惨…)
最后值得一提的是,Intel前一阵在大力推广其Evo认证(很多市售的十一代酷睿笔记本上都能见到Evo贴纸)。这个认证是面向笔记本的,即需要通过Intel的测试,才能标记EVO认证,确保更为一致的用户体验。这和当年的迅驰技术颇有些相似。
Evo平台的几个关键组成部分包括十一代酷睿处理器(包括Xe核显)、WiFi 6支持、雷电4接口、唤醒时间小于1秒、长续航、快充等。另一方面,还需要笔记本通过25项真实环境测试,如上图所示,主要应该还是集中于生产力和娱乐的。
Intel宣称,将M1版MacBook放到Evo的这些测试下,有8个项目都不合格。比如说在Outlook之下,切换到日程表应用,“与Evo性能要求相比,苹果M1慢了50%”;再比如从Zoom中开启视频会议,M1比Evo标准慢了31%。这些项目可能会有争议,而且仍与生态完善程度有莫大关联,不说M1,毕竟连Big Sur的完成度都算不上高。
不过Evo平台本身的存在,以及这些争论背后,我们仍然能够看到笔记本、PC正在走向进一步的完善。市场上的这些争论是健康竞争的表现,PC用户这两年获得的体验提升亦可谓前所未有。
十一代酷睿是Intel这些年来相当优秀的一款产品,即便周边的竞争对手也正亮出全方位的技术实力令其倍感压力。就像此前探讨LakeField那篇文章所说的,今年下半年的十二代酷睿Alder Lake,让人无比期待。
有关Tiger Lake十一代酷睿的更多探讨,包括Willow Cove处理器、Xe核显,点击下方的查看原文链接——作为对于如今Intel以及x86处理器的理解会有很大的帮助。