发力ARM服务器芯片市场 高通底气何在
2017-01-11
在服务器CPU市场,英特尔架构一枝独秀,市场份额已连续多年超过90%;POWER和SPARC虽然难挽下滑趋势,但在关键任务领域仍有用武之地;几乎已经退出历史舞台的Alpha架构得益于在中国超算“神威·太湖之光”中的大量应用,被注入了一支强心剂。
相比之下,数年前一度被寄予厚望、曾被视为数据中心低功耗变革动力的ARM架构却似乎慢慢淡出了我们的视线。然而,这并不代表它将在数据中心偃旗息鼓。时值2016年收尾和2017年开张之期,高通(Qualcomm)在ARM领域连番发力,让沉寂许久的ARM服务器阵营重鸣号角。
2016年11月18日,贵州华芯通开云棋牌官网在线客服技术有限公司北京研发中心正式启用。“华芯通”是由贵州省人民政府与高通公司共同出资设立的合资企业,已经获得ARM v8-A 64位处理器架构授权。“华芯通”将通过引进、消化吸收、再创新,重点针对高端服务器芯片指令集CPU微结构、多核互连、SOC等关键技术开展攻关,开发适合中国市场的先进服务器芯片产品。
2016年12月7日,高通宣布全球首款10纳米服务器芯片Qualcomm Centriq 2400开始商用送样,预计2017下半年进入商用市场。作为Qualcomm Centriq系列的首款产品,Centriq 2400采用最先进的10纳米FinFET制程技术,最高可配置48个内核,其所搭载的Qualcomm Falkor CPU,是高通研发的定制化ARM v8内核,通过高度优化可实现高性能,低功耗,特别针对数据中心最常见的工作负载而设计。
高通如此高调地对服务器市场“送秋波”、“秀恩爱”,既吸引了从业者的视线,也不免引发疑问:众所周知,高通是移动芯片领域的顶尖厂商,但缘何它会选择这个时间点发力ARM服务器芯片市场呢?
ARM芯片是否还有“搞头”?
这个疑问的根源,离不开ARM架构在服务器市场曾有的戏剧性发展经历。
大概是2010年,在移动端如日中天的ARM阵营表现出了对于服务器和数据中心的野心。当时,数据中心能耗濒临上限,“大数据”已经露出了爪牙,数据中心迫切地希望找到一种能以较低的功耗来处理大量并行化、轻量化负载的方法,而ARM架构处理器所具备的多内核、高并行、低功耗的特性正好满足了数据中心的这种新需求。
于是,业内普遍认为,ARM芯片将成为数据中心新的“颠覆者”,前景一片光明。随后,Facebook等大型互联网厂商开始定制ARM服务器,Marvel、Cavium、Applied Micro Circuits、三星等芯片厂商纷纷加入ARM服务器芯片的研发,惠普等服务器厂商开始测试ARM服务器,而2012年x86服务器芯片老兵AMD宣布推出64位ARM服务器芯片,更是为ARM进军数据中心加上了助燃剂。
当时,分析师们曾经乐观地预测,到2019年,ARM服务器芯片出货量将占到总体市场的20%~25%。
然而,ARM的数据中心之路走得并不如预料中那样顺畅。2013年底,ARM服务器领域的先驱Calexda成为“先烈”,为ARM在数据中心的发展前景蒙上一层阴影。2016年,Applied Micro表示将出售ARM服务器业务;也有消息称博通也将结束ARM服务器计划;而曾经让人看好的AMD,又将重心转回了x86和GPU。
所以,回顾这几年ARM服务器芯片的发展历程,好似“一壶水被迅速烧热又逐渐冷却”,这种尴尬局面让人不得不对ARM服务器芯片的未来感到困惑。
再回到上面的问题,ARM服务器芯片还有“搞头”么?高通为何在有先驱屡屡失利、甚至成为“先烈”的情况下高调进军服务器和数据中心?高通ARM服务器芯片赖以生存的根基和底气又在哪里?
高通在打怎样的“小算盘”?
高通是一家精明的企业,否则无以成为移动芯片界的龙头企业。在我看来,高通选择在这个时间点高调入局,其根本原因在于看好ARM服务器芯片市场的复苏趋势和发展前景。
的确,ARM服务器市场正在复苏。尽管经历了几年的不温不火,ARM服务器芯片却在近两年,特别是2016年,迎来了一个重要的转折点。
过去几年中,ARM服务器芯片在市场、技术和生态环境方面尚不成熟,而今,不管是市场、技术还是生态方面,它都面临着近年来最佳的一个生长环境。
第一,先看市场。前文提过,ARM的优势在于多内核、高并行、低功耗,这样的能力非常适合数据中心的并行化、轻量化负载,如搜索、Web、CDN、冷存储等。但由于ARM服务器芯片发展过慢,而英特尔x86服务器芯片的能效比也在不断提升,数据中心对于ARM的需求已经不是那么强烈。
如今的市场和几年前已经不可同日而语。时下,互联网日趋繁荣,移动终端数量高速增长,物联网快速发展,云计算、大数据、移动、社交引领了新一轮的技术革命。在这些新趋势中,数据有集中也有分散,不论是贮藏了海量数据的大规模数据中心,还是分散在网络边缘的计算节点,都希望将每瓦特性能放在首位,更加注重空间和能耗的节约,用更少的成本从数据的流动中掘金。
同时,人工智能、深度学习、机器视觉计算等新兴应用负载的大热将异构计算推到了舞台中央,单一的CPU架构已经无法满足这些应用对于浮点计算能力、并行度、能效等方面的需求,于是,近年来CPU+GPGPU、CPU+FPGA等异构计算方式大行其道,其中,ARM+GPGPU、ARM+FPGA也因更具能效优势,被视为一种理想的异构计算方式。
在这些新兴应用和趋势中,单纯的英特尔架构方案已经不能完全让大型数据中心的用户满意,虽然英特尔CPU的能效比在不断提升,并且也具备Xeon Phi协处理器方案,但大型互联网用户更希望追求极致,将数据中心的能效做到更高。
于是,ARM又迎来了新的机会。2013年百度在其南京数据中心首次应用ARM服务器来支撑百度云服务,将TCO降低了25%,存储密度提升了70%。本月初,又有消息称,ARM将与阿里巴巴集团在数据中心业务方面展开合作,阿里巴巴将在自身数据中心的服务器上大量采用ARM架构低功耗CPU,以逐步替换英特尔产品。
第二,再看技术。过去几年中,ARM服务器芯片的绝对性能提升并不高,故而ARM服务器只能被应用于一些轻量化的场景中。
而新近亮相的高通Qualcomm Centriq 2400,则将ARM服务器芯片的规格提升到了一个新的台阶:集成高达48个内核,率先采用10nm工艺(领先于英特尔的14nm),内核经过高度优化,可同时实现高性能与低功耗,专门针对数据中心最常见的工作负载而设计。虽然高通没有公布Centriq的进一步细节,但从核心数量和工艺上来推测,Centriq在性能与功耗方面的综合表现将能够与英特尔的主流芯片一较高下,且很有可能也领先于AMD即将推出的Zen服务器芯片。
另一方面,ARM+GPGPU、ARM+FPGA等异构计算技术也在不断走向成熟,特别是在超算领域。此前,巴塞罗那超算中心就曾采用ARM+GPGPU的异构方式,富士通计划建造的百亿亿次超算也将引入ARM芯片,同样采用异构计算。今年10月,英特尔子公司Altera推出了新一代的StraTIx 10 FPGA,其中就采用了四核ARM Cortex-A53处理器。
有趣的是,连英特尔都开始重新接受ARM架构,这足以说明ARM技术的诱人之处。
第三,最后看生态。由于缺少生态系统,特别是软件生态,ARM这些年来发展得不太顺利。而今,互联网的繁荣发展带动了开源生态的发展,也给ARM的软件生态带来了利好消息。
对此,Qualcomm产品管理副总裁乐美科(Americo Lemos)曾表示,软件过去大多是垂直的架构,而现在更多是使用开放源代码软件——这对Qualcomm来说是一件好事,因为入门的门槛变得非常低,不必再投资几十亿美金用于搭建软件架构。
他说:“就像x86系统原来做的那样。开放源代码软件的普及和应用降低了Qualcomm进入这一领域的门槛。”
所以,无论市场、技术还是生态,ARM进军数据中心已经处于一个“临界点”,高通在这个时间点高调入局,称得上是恰逢其时。
高通的底气何在?
不难预见,未来几年ARM架构在数据中心将大有用武之地,也将吸引更多的玩家加入,竞争也将趋于激烈。那么,对于高通而言,未来能否将在移动市场的优势延续到服务器和数据中心领域?我们不妨来简单分析一下。
首先,从产品技术角度来看,高通在ARM技术上有着多年积累,过去一直是对ARM架构利用、对其性能发掘最为充分的厂商之一,有着成熟的生态系统。高通在制程工艺上一直领先,这是未来高通能够保持优势地位的一个重要保障。
此外,高通处理器的集成度一直很高,是SoC技术领域的王者。比如它能在移动芯片中集成通信模块、多媒体功能、3D图形功能和GPS引擎,而据外媒透露,高通服务器芯片上将集成以太网、加密和PCIe等功能模块,也将以SoC的形态出现,这也是当前服务器芯片的一个重要发展趋势。
关于高通ARM服务器芯片的持续创新力,也就是它的研发力量,乐美科曾经在接受中国媒体采访时表示,高通已经具备研发服务器芯片的专门团队,同时也吸引了一批非常优秀的与云相关的工程师。此前,高通还曾演示了Qualcomm Centriq 2400 处理器上运行基于 Linux 和 Java 的 Apache Spark 和 Hadoop,对于这两个当前最为流行的大数据处理平台,看来高通已经早已开始着手准备了。
对于高通进军服务器和数据中心市场的优势,乐美科曾经表现得非常乐观:“第一,Qualcomm是真正的SoC设计公司,也就是集成芯片设计公司;第二,我们有最领先的制程技术;第三,我们在这个生态系统中也建立了多年的合作关系,能使我们在这个领域取得成功。”
乐美科谈到的生态系统的关系,其实就是高通的第三大优势。早在高通研发ARM架构服务器芯片之初,它就已经收获了互联网数据中心巨头Facebook的支持,一直在后者的开放计算项目(OCP)中占有一席之地。
2015年时,高通又与Xilinx和Mellanox达成了合作,携手提升ARM服务器芯片与FPGA芯片及数据中心连接解决方案之间的兼容性,预计这项协作的成果有望在2018年面市。在2016年早些时候,高通还与IBM、ARM、Mellanox及Xilinx等厂商共同创建了CCIX联盟,开始更为积极地参与对数据中心专用加速器芯片的标准定义工作,以求能够让自己未来的ARM服务器芯片能与这些加速器组合为具有强大竞争力的异构计算方案。
虽然高通这几次出手,还只是它在服务器生态系统营建方面的部分举措,但一直关注硬件技术的权威网媒Anandtech已经给出了这样的评价:“这足以说明高通在非常认真地对待自己的服务器业务。”
高通的最后一个优势,就是稳稳接上了中国的地气,抓住了进入中国市场的先机。中国市场对ARM有着旺盛的需求,在国家自主发展的政策引领下,中国服务器、HPC等关键信息设备亟需实现国产化,开放的ARM架构是一个重点发展的对象。
实现高通这一战略的关键举措,就是在2016年1月17日高通与贵州省人民政府签署战略合作协议并为合资企业“贵州华芯通开云棋牌官网在线客服技术有限公司”揭牌。根据协议,高通将向华芯通提供服务器芯片技术许可,并提供设计和技术支持。前文曾提及贵州华芯通开云棋牌官网在线客服技术有限公司北京研发中心在同年11月18日正式启用的消息,正是高通和贵州在ARM架构服务器芯片领域通力合作所取得的一个重要进展。
在移动芯片领域,对于如何借助中国手机厂商扩大产业生态,高通已经是个中好手,看来这种经验同样有助于高通扩大服务器芯片的生态。与中国地方政府成立合资公司,不仅有助于华芯通利用高通的技术优势,更为灵活地定制开发,更快地推出适合中国市场的服务器芯片,推动中国自主创新;对于高通来说,面对前景一片大好的中国市场,以这种技术输出的形式能够更快地站稳脚跟,做大中国市场的“蛋糕”。
能否撼动英特尔王座?
从Facebook、阿里、百度等大型互联网公司纷纷对ARM抛出橄榄枝,能够看出英特尔在数据中心的“王座”已经不再那么牢靠。
在云计算、大数据、移动、社交、人工智能、物联网所带来的这场新技术革命中,数据中心正从少数厂商、单一架构、软硬件紧密耦合引领的创新,走向用户引领、多方响应、异构共荣、软件定义硬件的创新。而高通在其中扮演的,正是一个带来活力、创造多样化和更多协作机会的角色。
但是,从唯物辩证法上来看,外因固然重要,内因才是起决定性的因素。数据中心新趋势、市场新需求给每一个ARM架构玩家提供的机会都是均等的,能否抓住机会,更多靠的还是自身的修为。
对于ARM服务器和数据中心领域的“后来者”高通来说,ARM“先驱”和“先烈”们的经验教训很值得参考,其一是要加快产品研发的速度,毕竟英特尔也即将在2017年推出10nm制程工艺;其二是要快速建立生态圈,弥补ARM在软件和应用层面的短板;其三,自然是要找到关键的客户,有了成功案例的刺激和示范作用,才能让ARM架构服务器芯片获得更大的动力和加速度。
未来不远,一切可期。2017年将是关键的一年,且看高通接下来如何出招。