11代酷睿桌面处理器体验:打造一台平价PC,需要注意些什么?
2021-04-01
来源: 电子工程专辑
这两天关注PC处理器的同学,藉由各种评测资料,应当都大致了解了十一代Intel酷睿桌面处理器产品——代号为Rocket Lake-S的处理器性能。前不久这个系列产品发布之时,我们也特别刊文介绍了这代Cypress Cove CPU架构,以及Xe核显GPU的概况。
我们拿到了最新的Intel酷睿i9-11900K(8核16线程,睿频5.3GHz,125W TDP)和酷睿i5-11600K(6核12线程,睿频4.9GHz,125W TDP)。其中i5-11600K目前在京东的报价是2349元人民币,不带Xe核显版的11600KF则为1699元人民币——算是近代酷睿中端定位产品中相当有性价比的一款了,虽然也和AMD太过强势有关。
借此机会,我们组装了一台基于酷睿i5-11600K的平价PC,也正好聊聊现如今的平价PC在性能上可发挥到什么程度——比如能玩哪些游戏;并且也顺带谈一谈酷睿i9-11900K这款年度旗舰PC处理器的表现怎么样。
搭建“平价”平台
有关这两款处理器的具体配置就不赘述了,可参见此前发布之时的介绍文章。我搭建的这款“平价PC”整体配置如下:
处理器:Intel酷睿i5-11600K(Rocket Lake-S);
主板:ROG MAXIMUS XIII HERO;(BIOS固件更新日期2021年3月15日,ME固件版本15.0.20.1466)
内存:金士顿8GB x2 DDR4 3200;(以下体验全部基于XMP II, DDR4-3200, 16-18-18-36-1.35V这个配置)
硬盘:三星980 PRO 500GB SSD;
显卡:Nvidia Geforce GTX1060 6G;
这里面可能主板不够平价——选择这个主板纯粹是因为手头有现成资源。选择其他500系列芯片组平台,就“平价PC”的目标用户群——包括平常会玩游戏,且用PC办公、中轻度多媒体创作、编程等比较普适的人群——也是完全没问题的。
这里DDR4 3200内存和PCIe 4.0 SSD也都是为了搭上十一代桌面酷睿新技术的班车——而这两款产品又不会显得那么超前和昂贵。
另外,显卡选择Geforce GTX 1060,一方面这半年因为全球缺芯的关系,显卡价格都翻番了——即便是GTX 1060 6G,如今的价格都高达2800元,比4年前发布时的价格都还要高;另一方面,这款Pascal架构的GPU如今在Steam平台,依然是市场保有量份额最高的显卡产品,实在是平民化产品中最有说服力的一款了。
与此同时,在散热方案上我选择的是风冷:Cooler Master暴雪T400V2,外加ARCTIC MX-4导热硅脂。这个方案要压住酷睿i5-11600K应该不成问题,应对极限状态的酷睿i9-11900K可能会比较勉强。
作为对比,酷睿i9-11900K也会加入到这个平台中来做体验测试。这套方案中,显卡以及散热系统可能会成为性能发挥比较大的瓶颈。
两个关注点:ABT与Gear 2分频
在组建这台PC的过程中,有两点比较令人在意,也是爱好者们组建自己的PC时在设定上需要在意的问题。其一是在我们拿到两款处理器后的不久,Intel就宣布推一个叫Adaptive Boost Technology的技术(以下简称ABT)。从Intel的官方描述来看,这又是个多核睿频方案,可以在某些情况下推升更高的全核心频率,不过只面向酷睿i9。ABT需要在BIOS中启用,默认是关闭的。
ABT主要是在供电和散热方案有富余的情况下,实现8个核心同时达到5.1GHz的频率。如此一来,Intel现有的睿频方案(也就是市场营销词汇)就有些复杂了。早前Intel有个Turbo Boost 2.0;后来出现了Turbo Boost Max 3.0(针对体质比较好的核心,获得额外的睿频);再后来有了Thermal Velocity Boost(在没有撞到温度墙的情况下,频率可再得到100MHz的推升)。
这次的ABT从名字来看,是个“自适应”的浮动睿频方案。Intel规范下的这些睿频技术,仍然受到PL2和Tau值,以及温度墙(TVB的温度墙为70℃)的限制。ABT这类技术的存在,大致上表明了Intel对其14nm工艺也算是彻底挖掘干净了。
不过主板厂商可以一定程度无视Intel睿频的规范值。比如我们手头这款ROG MAXIMUS XIII HERO主板的BIOS选项中就有个Multi-Core Enhancement(多核增强,以下简称MCE),是ROG主板的常规选项——许多板卡厂商面向用户也都有此类设置项。它与Intel的ABT会是什么关系,将是本文会探讨的一个话题,虽然ABT和酷睿i5没什么关系。
另一个关注点则在于,对于内存DDR4-3200而言,仅有酷睿i9-11900K/11900KF才支持Gear 1模式——也就是内存控制器与内存频率之比为1:1;其余包括酷睿i7、i5在内的型号,在内存达到该频率时均需分频,也就是Gear 2模式,内存控制器与内存频率的比值会切分为1:2。
在DDR4-2933规格下,所有型号才可支持Gear 1模式。也就是说,这台“平价PC”选配的DDR4-3200内存在给酷睿i5-11600K做配时,默认内存控制器的频率会降到800MHz(即双工1600 MT/s)。在BIOS中,手动设置内存频率为DDR4-2933,并将内存控制器与内存频率比值设为1:1,理论上会获得更高的内存使用效率。
那么Gear 1和Gear 2在我们这套平台上,会造成多大的性能差别?这也是测试中尝试探讨的话题。
最后,因为手头没有竞品和Intel前代产品做测试对比,孤立地罗列测试数据可能会比较没有参考价值。不过若今后还有机会做此类体验,这些数据将作为后续其他同类产品对比的依据。而且下面的测试项都很常见,要作为横向对比的数据,依然是有意义的。而且测试多以高层级的系统及真实环境体验为主,因为时间也比较有限,并未做更细致的底层剖析和探讨。
游戏体验:Gear 1/Gear 2在平价PC上的性能差别
国外有平台已经对比过Gear 1和Gear 2模式下,游戏性能的差别(因为游戏属于比较典型的内存时延敏感型应用)。就体验角度来看,两者在大部分游戏下的体验差距并不大。《GTA 5》《全面战争:三国》《F1 2020》等游戏在这两种模式下,能够表现出1%-4%的性能差距,《赛博朋克2077》这样的游戏则几乎没有区别。
酷睿i5-11600K在Gear 2分频模式下的cache与内存测试数据,内存延迟还是相对比较大的。
但就爱好者的角度,在游戏中1%-4%的帧率数值差距,也足够令人急眼了(也是与上一代酷睿做性能比较的依据)。事实上从体验角度,即便是生产力应用,如Chromium编译、Blender渲染,Gear 1、Gear 2也不易造成实质上的影响。
不过网上那些对比,大多是全豪华平台,包括选配的RTX 3080,64GB RAM等;和我们这些普通用户关系好像并不大。所以在我们搭建的这个平价PC上,Gear 1和Gear 2是否有差别?
这里选择了5款游戏来作比较,分别是《古墓丽影:暗影》《CS:GO》《全面战争:三国》《刺客信条:英灵殿》《彩虹六号:围攻》。除了《彩虹六号》(Ultra超高画质)外,其他游戏均选择高画质、1080p分辨率(毕竟上2K是有些为难GTX 1060了),都关闭垂直同步。
除了酷睿i5-11600K的Gear 1(内存控制器频率1466MHz,内存频率1466MHz)和Gear 2(内存控制器频率800MHz,内存频率1600MHz),这张表也加入了酷睿i9-11900K的数据。值得一提的是,这里的对比均开启了MCE。从这张表至少可得出以下结论:
1.虽然Geforce GTX 1060已年代久远,但普通用户若非太过注重画质或者要玩赛博朋克一类的当代3A大作,拿这款显卡玩一般游戏也还是够用的。怪不得Steam上的GTX 1060钉子户还是那么多(人手2080/3080那是假象)。
2.酷睿i5-11600K在Gear 1和Gear 2两种模式下,游戏体验差距几乎可以忽略不计。这也可能与Geforce GTX 1060作为系统瓶颈有关。
3.由于Geforce GTX 1060系统瓶颈的存在,酷睿i9与酷睿i5在该PC平台上没有表现出游戏体验的差距(即便酷睿i9开启ABT睿频)。所以对于平价PC的目标用户,如若考虑配顶级CPU,也需要以同档GPU、RAM等做配;或者说根据整个系统来选择合适的硬件,才能发挥系统最高的效率。
主板出厂时,针对十一代酷睿i5/i7默认即为Gear 2分频模式。这将浪费部分内存效率。所以就需要爱好者们手动修改内存频率,挖掘更多的性能潜力——即便在平价PC上其提升十分有限。
这种Gear 2分频,与此前AMD处理器的FCLK分频应当是类似的。AMD在近代锐龙处理器上引入了一种名为Infinity Fabric的互联方案,Infinity Fabric将CPU核心与系统内存、其他系统组件(PCIe、南桥等)做了连接。
Infinity Fabric有个时钟叫FCLK。FCLK频率越高,理论上CPU核心与系统其他部分连接的带宽就越高。理想情况下,FCLK与内存频率一致时(1:1)效率最高。两者出现不同步时,就会存在时延。Infinity Fabric也确实存在频率上限(准确地说是Data Fabric的GMI2模块存在频率上限),大约在1900MHz附近。
AMD Zen 2架构下,内存频率与FCLK频率解绑——这一点我们此前的文章也提到过。1:1的这种关系就被打破了,分频这个概念因此出现,内存延迟增加(且CPU核心与内存通讯还需要经过I/O die)。AMD此前将Infinity Fabric位宽翻倍,以及增大处理器的L3 cache来缓解带宽和延迟问题。
酷睿i9-11900K的cache与内存测试
Intel的情况可能与此相似,当然内存超频在此仍是个选择。不过今年十一代桌面酷睿CPU的L3 cache并没有提升(i5-11600K相比i5-10600K,两者L3 cache都是12MB)。从这个角度来说,独占DDR4-3200 Gear 1的酷睿i9-11900K/11900KF,还是有存储系统方面的优势。
ABT与MCE都开吗?
要理解ABT(Adaptive Boost Technology)这种技术的效果,还是得借助于Cinebench这类基准跑分。下面这张图给出了酷睿i9在ABT与MCE(Multi-core Enhancement)不同开关组合下,Cinebench R23与Geekbench 5的跑分(其中Cinebench R23连续跑10分钟);另外也附上了酷睿i5的跑分,同样开启MCE。
这个分数仅在此处做比有价值,因为整个平台的配置并不高(且很大程度受到风冷散热方案的限制),酷睿i9搭配更高配的方案还能获得更好的成绩;但在此做对比依然是有参考价值的。
这张表可得出的结论是,同时开启ABT与MCE能够获得最出色的性能——也就是同时开启Intel的睿频方案,与板卡厂商更激进的温控与功耗策略,可获得最佳性能。另外,ROG这张主板提供了AI超频方案,在BIOS中一键选择就给出了电压、频率方面的自动搭配——这也算是一种官超,其设定本质上还是偏保守的。
所以就酷睿i9-11900K而言,BIOS中的简单设置,Cinebench R23多核性能测试就能获得大约10%的性能提升。
酷睿i9-10900K,MCE/ABT都关闭时,Cinebench R23前5分钟跑分的CPU核心频率与Package TDP功耗曲线(左侧的数据为截图当下的值,可忽略)
观察酷睿i9-11900K的MCE/ABT都关闭,以及都开启,两种状态下进行CineBench R23跑分时,CPU核心频率、Package功耗参数变化。在MCE/ABT全关的情况下,Package功耗冲高到199W即回落;起初最高核心频率曾达到5.2GHz,并快速回落到4.7GHz左右,在1分多钟后降到4.2GHz附近,Package功耗稳定在125W,Package整体温度(70℃附近)也比较保守。
酷睿i9-10900K,MCE/ABT都开启时,Cinebench R23 10分钟跑分的CPU核心频率与Package TDP功耗曲线(左侧的数据为截图当下的值,可忽略)
而在MCE/ABT都开启的情况下,Package温度在很短时间内就达到了100℃,后续稳定在90℃,Package功耗曾一度达到290W——这个数字还是颇为惊人的;并且功耗在200W以上还维持了一小会儿(约15秒);后续也一直稳定在172W附近;全核心频率稳定在4.55GHz。这种模式下,散热系统已经成为酷睿i9-11900K性能发挥的瓶颈,所以我们搭建的这套系统的确无法真正发挥i9-11900K的性能。
值得一提的是,若只讨论ABT特性,则在开启ABT以后(无论MCE是否开启),系统有着明显更为激进的功耗策略。比如在开启MCE但未开启ABT的情况下,Package功耗不曾突破过200W,虽然测试后续的5-8分钟也基本维持在170W上下。
而主板厂商的MCE特性(有些可能叫Multi-Core Turbo),则有着更坚挺的持续性能策略。在未开启MCE、而开启ABT的情况下,Package峰值功耗虽然也能达到244W,Package温度一度升至90℃,但很快核心频率掉落到4.2GHz,功耗也稳定在125W。
酷睿i5-11600K开启MCE,Cinebench R23前5分钟跑分的CPU核心频率与Package TDP功耗曲线:Package功耗基本稳定在142W附近,全核频率全程4.6GHz左右。
所以说,就我们的测试来看,ABT与MCE双开时,系统有着最为激进与持久的温控和功耗策略。追求极致性能的爱好者应当将这两者都置于开启状态(对酷睿i5/i7而言,也只有MCE能开)——虽然后面会提到,就高度抽象的系统层面,由于我们搭建的这套平台各种瓶颈的存在,这么做就体验而言也无法表现出太大的优势(前文的游戏测试就已经佐证了这一点)。
事实上,这些也能反映Rocket Lake-S的高性能需以较高的功耗和温度为代价。上面这张图是在同时开启MCE与ABT时,对酷睿i9-11900K进行10分钟的AIDA64压力测试时的温度、功耗、频率、电压大致情况。
生产力、多媒体与娱乐性能
这两年因为竞争对手各方面的压力,Intel在处理器宣传中愈发喜欢谈“使用体验”。这个方向对用户而言一定是没错的,毕竟性能数字是需要落实到具体的应用中的。
针对实际性能体验,我们跑了PCMark 10(Office办公套件),以此作为生产力性能代表;针对多媒体应用,测试的是Adobe Lightroom Classic、Premiere Pro、AE(After Effect);日常网页浏览的测试对象WebXPRT 3。这些都是生活、工作中比较具有代表性的测试项。
需要指出的是,这些测试更偏向整体系统性能,存储、RAM、图形计算甚至软件也都有着显著更高的参与度。如此一来,这些CPU自身对于这类系统性能测试的影响就变得比较低了;尤其当我们搭建的整个系统存在性能瓶颈时。
注:英伟达的Geforce GTX 1060最新驱动似乎有些问题致PCMark 10无法跑完测试,所以PCMark 10的测试全部基于Intel核显(UHD 750,即32EU的Xe)
所以从这些跑分来看,酷睿i9-11900K的ABT开启与否实则都并未对这类系统测试产生太大的影响,毕竟这次体验的主角仍然是酷睿i5-11600K——也更适配我们搭建的平价桌面PC。
最后值得一体的是,Rocket Lake处理器的部分SKU集成了Xe GPU。不过我们测试的这两款处理器内置的Xe GPU仅有32EU,并不是十一代酷睿笔记本平台(Tiger Lake)那样的96EU,其图形计算性能因此并不像笔记本平台那么彪悍。
不过这代Xe核显的用处大了很多,我尝试用核显来跑《原神》,720p极低画质下还是具备了可玩性的——核显性能感觉与Ice Lake-U(十代酷睿移动平台)颇为相似;与此同时跑刀塔这类游戏是不在话下的;另外一点比较重要的是QSV引擎增强,尤其HEVC支持和流行CODEC的带宽翻倍,对于视频剪辑这些工作会很有帮助。
整体看来,酷睿i5-11600K(以及i5-11600KF)是Rocket Lake-S这代过渡产品中相当有性价比的选择;也是选配平价PC值得考虑的对象。不过这里的GPU要重新考虑一下,比如在未来几个月GPU价格稳定后,考虑30系的甜品级显卡——毕竟还有Resizable BAR这种相当令人期待的特性加持。
至于酷睿i9-11900K,其实这次搭的平台并不能发挥其实力。事实上,Cypress Cove(即Rocket Lake-S的CPU)将10nm的Sunny Cove微架构(Ice Lake-U的CPU)回迁到14nm制造工艺,这个过程对Intel的工程师而言也并不容易。尤其要在晶体管尺寸或间距更大的情况下做设计,信号传输、数据路径都要重做。比如信号完整性针对更长的路径或者延迟,都还需要做各种考量和升级;另外14nm工艺应用更需要考虑到功耗、尺寸之类,相较原10nm的权衡。
所以我们会看到酷睿i9-11900K并没有选择堆更多的核心,核显EU数也并不算多,皆与其间权衡相关。不过延续了五代的架构首次换新,Rocket Lake-S的实际表现除了基本符合Intel发布会上的预期,也是在为Alder Lake这样的产品做更充分的准备了。