通向性能大爆发的前夜 2016年处理器市场总结
2017-01-05
事物在发展过程中,都有不同的阶段,而对于处理器这条产品线来说,2016年就是那进入爆发一刻的前夜——就AMD而言,2016是新一代ZEN架构处理器加速冲刺的一年,ZEN处理器的各种研发、流片工作已经全部完成,ZEN将在2017年展现出它的全部威力。同样,在2016年英特尔也加紧推出了其采用14nm+工艺的Kaby Lake移动版处理器,并将在2017年带来性能更加强大的台式机版产品。因此简单来看,2016年就是处理器通向那性能大爆发的前夜,只不过在这一夜却并不那样平静,处理器厂商依然给消费者带来了众多惊喜。
AMD:大力推广多核心运算
随着编程语言、编程技巧的提高,各类游戏、应用软件对多核心处理器的支持也越来越好。因此传统处理器厂商AMD在2016年的一个重点就是加大力度普及多核处理器。首先在去年第二季度,AMD在倍受玩家关注的千元级处理器市场推出了最新的8核心处理器:FX-8370。经过工艺上的改良,FX-8370处理器的最大加速频率达到4.3GHz之高。
同时它还配备了名为“幽灵”的四热管大型散热器,可借助“幽灵”散热器稳定超频到4.8GHz,算术性能达到可观的99.47GOPS,其性能在中高端处理器中非常突出。当然,AMD也没有忘记主流市场的消费者。在2016年发布的新速龙845就是其中值得一提的产品,它采用了更先进的CARRIZO核心,核心面积相比上代产品缩小了23%,功耗降低了40%。同时它仍采用了四核心设计,并拥有3.8GHz的加速频率,价格却不到400元,这让它在市场上得到了主流消费者与网吧业主的青睐。
AMD:不断提升能耗比的APU
依靠工艺的进步,AMD的APU在2016年也保持了高速更新,首先最值得关注的就是A10-7860K处理器。虽然这款产品采用的也是Kaveri Refresh核心,但A10-7860K的TDP热设计功耗却从A10-7850K的95W大幅降低到45~65W(动态调整),而它的处理器加速频率仍保持在4.0GHz,GPU频率还从720MHz提高到757MHz,使得这款APU具备更高的能耗比。
凭借更高的能耗比,适中的价格,A10-7860K在去年的主流APU市场成为了焦点。
同时AMD还在2016年推出了一款旗舰级APU产品—A10-7890K APU。得益于工艺上的优化,这款APU的处理器与图形核心工作频率都有不小的提升。其加速频率达到4.3GHz,拥有多达512个流处理单元的GPU核心工作频率则进一步增加到866MHz。从实际使用来看,A10-7890K APU已具备在全高清分辨率、中等画质设定下流畅运行《坦克世界》、《使命召唤:黑色行动3》的能力,令它成为高配整合电脑中的首选核心。
AMD:率先在整机产品采用新一代APU
在2016年,AMD还发布了基于Bristol Ridge架构的新一代APU。Bristol Ridge和Kaveri APU关系不大,反而可看做是之前移动版APU:Carrzio架构的进化版本。它的CPU部分采用了改进版本的“挖掘机v2”,GPU部分改进至GCN 1.3(或者称为GCN 3.0)。Bristol Ridge的主要特色在于它具备更高的同频性能,并大幅提升了显示核心的工作频率,旗舰产品A12-9800的GPU加速频率达到1108MHz之高。当前,Bristol Ridge APU主要用在惠普、联想等厂商的整机产品上,预计2017年会出现在零售端市场上。
总体来看,独显平台方面,AMD提供了完整的多核心处理器解决方案—从不到400元的四核心处理器再到700多元的FX-8300八核心处理器,乃至上千元的高频八核心产品;而在APU方面,同样从几百元到最高千元出头的多款APU也让用户能以很低的成本就拥有四核心处理器,以及可流畅运行主流游戏大作的GPU核心。
这些产品都遵循了AMD长久以来“相同价格、性能更强”、“相同性能、价格更低”的产品设计策略,而这正是AMD面对强敌能不断发展、生存的主要武器。显然,如再借助内部设计与性能上取得大幅进步,即将上市的ZEN架构处理器Summit Ridge,AMD处理器在2017年的表现将更值得期待。
英特尔:整合更多核心 主攻高端与服务器
在主流消费级市场,英特尔去年仍以前年发布的第六代酷睿处理器为核心,如Core i7 6700K、至强E3-1230V5仍是去年的明星产品。因为主流领域的市场需求得到满足,所以在去年英特尔的更新重点放在了消费级高端与服务器领域,其所依赖的就是Broadwell-E/Broadwell-EP核心。
由于本次从Haswell-E/Haswell-EP进化至Broadwell-E/Broadwell-EP属于英特尔架构改进中的“核心不变、工艺改进”的步骤,也就是传说中的“Tick”步骤,因此整体核心只是微调。如乱序调度器窗口更大(从60提升至64)、允许更多的指令被重新排队,相应地提高了IPC,其IPC性能略微提升了5%。
与上代产品相比,Broadwell-EP在核心数、线程数、缓存容量上的提升是最主要的更新之处。
架构方面的总体改进并不大,包括core和uncore的前端、指令解码、缓存、各种功能单元、总线、接口等,都基本维持了和Haswell-EP一样的设计。尤其是从Ivy Bridge-EP就开始使用、在Haswell-EP上大幅度改善调整的环形总线,在Broadwell-E/Broadwell-EP上得到了全盘继承。
相比之前的Haswell-EP上最多挂载18个处理器核心,Broadwell-E/Broadwell-EP上最高可挂载24个处理器核心,其双向、分组环形总线的设计和缓冲器方案,使得英特尔能够在更多核心的情况下,实现核心资源的有效调配和控制。因此Broadwell-E、Broadwell-EP处理器的一个主要更新就是推出了核心数更多的产品。
消费级产品方面,英特尔推出了最高拥有10核心的Core i7 6950X;服务器领域上,英特尔更带来了拥有22核心的至强E5-2699V4处理器,以及拥有24核心的至强E7-8890V4。而这只是开始,在2017年英特尔还将很快推出多达32核心、64线程,基于Skylake-EP核心的至强E5-2699V5。究其原因,还是在于现在支持多核心运算的软件越来越多,不论是家用运用环境还是服务器应用环境,都可以通过增加处理器核心数量在体验上获得一定的改善,因此核心数量的增加还将持续进行下去。
英特尔:全面应用14nm 频率获得小幅提升
另一方面,英特尔处理器在去年的最大改变就是全面采用了14nm,包括采用Broadwell-E/Broadwell-EP核心的高端处理器与服务器产品。它们不仅更节能、可以容纳更多的元件、生产成本更低,也带来了处理器工作频率的提升。
在2016年年底露面的Kaby Lake主要改进了14nm生产工艺,在体系架构上并无大的改进。
如在Broadwell-E处理器核心上,它还带来了一个新特性—支持Intel Boost Max Technology(IBMT)3.0技术,与睿频2.0技术配合(而非取代),使得处理器最大睿频达到了4GHz。而它的TDP依旧与Haswell-E一样为140W,在其核心、线程数进一步增加的同时,TDP依旧不变,足见14nm工艺确实不容小觑。
在去年第四季度推出的至强E5-2699A V4处理器拥有高达2.4GHz的基准频率、3.6GHz的加速频率,再配合22核心、44线程设计,使得它的多线程运算性能十分强大。
而在服务器处理器方面,尽管至强E5 V4版本的核心数已达到最高22颗,但英特尔仍为它设计了较高的工作频率。其最新推出的E5-2699A V4处理器的基准频率达到2.4GHz,睿频加速最高频率甚至可到3.6GHz,而TDP却仍仅有145W。因此在去年架构没有大幅改变的情况下,通过核心数量的增加与频率的提升,英特尔高端处理器与服务器产品在性能上仍获得了明显的进步。
英特尔:“挤牙膏”的代表——Kaby Lake开始崭露头角
主流市场方面,英特尔Kaby Lake只是Skylake的加强版而已,主要改进了14nm生产工艺。
优化后的14nm工艺使用了更高的鳍片与更宽的栅极间距,可减小驱动电流,降低漏电概率;而更宽的栅极间距则可以降低晶体管密度,允许每个晶体管产生的热量有更多的空间扩散,这有助于降低内核温度并提升频率,这也就是说Kaby Lake可以使用更高的工作频率,具备更好的超频能力。如其旗舰版Core i7 7700K的默认频率就达到4.2GHz,而Core i7 6700K的默认频率为4.0GHz。
Kaby Lake的配套核芯显卡支持硬件编/解码更多格式的4K视频,可以减小CPU的播放功耗,延长移动平台的续航时间。
此外根据泄露出的评测数据来看,Kaby Lake的风冷超频频率可以稳定在5.0GHz。因此Kaby Lake处理器的改进实质还是提升能耗比—在同样功耗下,工作在更高的频率上。同时Kaby Lake配套的核芯显卡对4K视频的回放进行了改良,增加了H.265 Main.10、VP9 8/10-bit格式的硬件解码与编码,不仅可流畅播放更多格式的4K视频,也可大幅降低4K视频播放或编码时的功耗。
综合来看,在处理器领域英特尔近几年来执行的“Tick-Tock”战略并不是让用户很满意,尤其是在主流消费级产品领域—“挤牙膏”几乎成了每一代英特尔新处理器的特征。那么什么时候才能再出现从奔腾4到酷睿那样翻天覆地的变化呢?这或许还得看竞争对手能给英特尔带来多大的压力,我们期待在预计2018年发布的10nm Cannon Lake上能看到这样的奇迹。
兆芯:大有潜力的国产x86处理器
在以往每年的年终特刊处理器盘点中,我们一般只会总结AMD与英特尔两家,且与消费级应用紧密相关的x86处理器。而在去年总结文章的最后,我们认为兆芯这一主攻消费级应用、在2016年行业市场上有所斩获的国产x86处理器,也是值得一提的。从技术层面来说,兆芯与AMD、英特尔尚有差距,其主力产品有开先ZX-C四核和ZX-C+四核两类处理器,两者均基于28nm工艺制造,主频最高2.0GHz,兼容x86指令集,支持CPU虚拟化技术。
规格上来看,它们并不出众,但它们的优势在于有针对中国政府、军队的安全性设计。特别是ZX-C+四核处理器支持SM3和SM4高速国密算法指令。对于一般消费者来说,他们是用不到SM3、SM4国密算法的,该算法主要嵌入到商业、电信、金融应用中,并在这些应用建立通讯信道的时候,启用这两种加密算法。
最简单的例子,我们的银行卡、手机卡、社保卡、身份证都有使用国密算法用来保护信息、通讯指令。而在计算机应用中,国密算法则是主要保护那些按保密法规定、涉及机密的文件、党政机关文件,以及来自电子政务网的文件传输都会采用类似加密。传输的时候软件自己就会进行加密,再到另一端进行解密。
兆芯ZX-C处理器内部架构图,四颗核心清晰可见。
但是如果处理器不支持SM3、SM4算法指令集,那么它们就会用软件加速进行加密、解密,速度会很慢。而兆芯的ZX-C+处理器由于在硬件设计上先天就支持SM3和SM4高速国密算法指令,因此其加密、解密速度会明显快于普通x86处理器。
同时根据MC评测室的多次测试来看,即便是“低配”开先ZX-C四核处理器也可以轻松完成Word文档编辑、多网页浏览、1080p高码率高清视频播放、图片编辑等办公应用,与AMD、英特尔的产品在进行这些应用时也没有明显差别。甚至在搭配低端独立显卡的时候,ZX-C处理器也可在高画质设定下流畅运行《英雄联盟》、《穿越火线》等主流网络游戏。
也正是基于其的确具备可用性,兆芯ZX-C处理器已被联想、同方、仪电等国内整机厂商采用。基于兆芯ZX-C处理器的联想开天M6100台式机、开天A610K一体机、昭阳CF03笔记本等产品也通过了国家强制性3C认证、能效一级认证以及中国节能认证、绿色环境标志认证,并正式入围政府采购的节能产品目录和绿色环境标志产品目录。同时,采用兆芯国产x86通用处理器的整机也先后在上海市所属的近400家单位正式应用。
因此我们认为,如果兆芯处理器未来的生产工艺能按时顺利升级到16nm,并完成主板北桥芯片组与CPU的整合,实现架构上的飞跃,那么兆芯处理器不仅将进入更多的政府单位,甚至有可能进入消费级市场,让普通PC也用上我们的国产处理器。