时隔五年,ARM再次向数据中心领域发起进攻
2019-03-04
作为在智能终端领域呼风唤雨的角色,ARM的崛起在很大程度上构筑起了今日终端市场的繁荣。由于采用授权、版税和软件平台服务为主的盈利模式,ARM能够尽量避免在制造和工厂方面分心,将大部分精力都投入到芯片产品的研发设计和相关软件平台的开发上,从而推进产品快速进步。
而这也正是华为海思、高通、苹果等企业能够在芯片业务上一年一旗舰的快速推出产品的核心原因。
当然,既然已经在智能终端领域只手遮天,下一步就必然是利润更丰富、前景更好的数据中心领域了。
在2011至2013年,以高通、Calxeda、SeaMicro为首的ARM阵营曾向数据中心领域发起了一轮声势浩大的进攻。希望凭借更好的能效、海量的核心数量来在云化数据中心领域攫取一块市场。不过面对强大的Intel以及相对贫弱应用和生态系统,当初信心满满的各路ARM英豪最终也都偃旗息鼓。高通数据中心业务被边缘化,甚少有新消息传出,SeaMicro被AMD收购,Calxeda耗尽现金流倒地而亡……
虽然第一批ARM数据中心方案的探索者没有成功,但ARM并没有放弃自己对数据中心市场的野心。被迫退回原有市场的ARM做了两手准备,并在5年之后重新杀向数据中心市场。
发力HPC领域
2011年,日本超算Kyo在人类历史上首次实现了10petaflops(亿亿次)的计算性能。从Kyo开始,人类也就开始了向E级计算(百亿亿次)挑战的征程。根据全球各大超算强国公布的下一代E级超算时间表来看,美国、中国、日本和欧盟的对应产品都将在2020-2023年之间完成组装和调试。而除了性能之外,各国对E级超算的核心需求除了性能之外就是自主可控了。
富士通A64fx处理器
由于没有自己的专属处理器架构(Intel、AMD及IBM同为美国公司,他们掌握核心专利的x86、POWER架构可以理解为美国的专属产品),中国、日本及欧盟无一例外的将目光投向了更加开放的ARM架构。其中,中国的天河3号将采用飞腾公司研发的FT2000 Plus 64核ARM芯片(中国另有一套曙光公司的神威E级方案,处理器采用SW26010,属于RISC架构);日本的后京(Post Kyo或Post K)将采用富士通的A64fx ARM架构64核心处理器;而欧盟的E级超算虽还没有明确具体架构,但预计会在CPU方面采用ARM架构、在加速卡方面采用RISC-V开源指令集。
飞腾公司FT-2000 Plus核心架构
巨头们的选择虽然有些无奈,但在RISC-V、Open SPARC等开源架构中,ARM仍旧是平台生态最好、产品最完善的一种(ARM并非开源,但其授权模式却相对开放;而且ARM是英国公司,并被软银控股,很难收到国际政治关系和格局影响)。
另一方面,ARM公司在ARM v8.2A架构中加入的SVE(Scalable Vector Extension)技术也能够在很大程度上提升对应的ARM处理器在大规模互联场景中的性能表现,使其更适合应用在HPC这种大规模集群之上。
至此,在象征计算技术最前沿的E级超算领域,ARM架构基本占领了五分之三的份额,实现了对数据中心市场的跃鼎打击。
云化数据中心里的ARM
虽然E级超算对ARM架构青睐有加,但这显然不能给ARM公司贡献多少有意义的营收。ARM的真正发力点仍需要放在商用数据中心市场上。
而随着主流Linux系统对ARM处理器支持的越来越好,以Marvell公司ThunderX处理器为代表的ARM阵营也开始了向商用数据中心领域的再一次进发。
在大型数据中心纷纷完成云化之后,下一步的发展方向便是容器化及其背后对应的serverless模式。在强大的Kubernetes加持下,以往复杂而臃肿的应用和服务可以被更加轻量化、扩展和迭代更方便的微服务模式所取代。而对于数据中心来说,这种更加碎片化的应用交付和部署模式显然可以进一步提升硬件的利用率,并进一步降低云的成本。
Cavium ThunderX2处理器
(Cavium雇佣了前博通工程师并购买了博通vulcan IP——博通公司的ARM处理器项目,最终被Marvell以60亿美元收购)
这种碎片化的应用或计算在很多情况下并不会产生太高的计算需求,如果仍以庞大的x86 CPU核心或vCPU来运行的话显然会产生一定程度的浪费。而以ThunderX CN9980 2.5GHz处理器为例,1790美元售价将包含32个核心、128线程以及56个PCIe 3.0通道和8个DDR4内存通道以及高达2TB的内存支持;功耗也只是180W。另一方面,ThunderX处理器内部还集成了一个高性能25Gbps网络控制器,相当于为服务器提供了一个廉价的高性能网络集成方案。
华为鲲鹏920处理器规格(在不同场合中也可称为Hi1620)图片源自mobilemagazinehk
除了Marvell的ThunderX2之外,华为也推出了自己的鲲鹏920处理器及对应的泰山服务器产品。相对于ThunderX2,鲲鹏920直接采用了更先进的7nm工艺和ARM v8.2架构,并在180W的TDP之下提供了64个运行于2.6GHz频率的核心、8个DDR4内存通道和40个lane的PCIe 4.0连接。当然,华为也发挥了自身在网络技术方面的优势,为鲲鹏920内置了一个100Gb的RoCE控制器。
目前,AWS已经批量部署了自己的基于ThunderX2方案的ARMbased服务器,并开始对外提供服务。而各家ARMbased服务器产品也大多瞄准云计算、分布式存储等数据中心的核心应用场景以及一些原生Android服务的新领域。
ARM在数据中心市场能成功吗?
与第一次冲击不同,此次在助推ARM向数据中心市场前进的厂商包括了Marvell和华为等资深企业级厂商。他们均在数据中心市场中拥有广泛的合作生态和丰富的商业经验,这无疑会给ARM在数据中心市场中的发展提供强大的支持。
虽然现在来给ARM在数据中心市场上的表现定结论还太早,但在吸取了第一次的教训并获得了强大的支持后,ARM未来的数据中心之路显然会走的更好、更远。