(本文刊登于Extension Media,经授权在电子技术应用平台首次以中文形式刊发)
应用基于低延迟/低功耗的新型存储级存储器的子系统来优化服务器设计以消除计算/存储一侧的瓶颈。
超融合架构扰乱了传统的存储和数据中心市场。因为超融合架构为各个组织开辟了一条新的途径来强化他们的系统,降低了他们的成本,减轻了他们的管理负但。根据Gartner的研究报告,“超融合集成系统市场将会迎来79%的增长,达到2016年的近20亿美元,从而在未来的5年后将其推进主流应用中。超融合集成系统将会成为整个集成市场中增长最迅猛的细分市场,在2019年前,将会达到将近50亿美元的规模,占总体市场的24%”。
什么是超融合架构HCI?
超融合架构(HCI)是一种把存储、计算和网络连接结合到一个单一系统的框架,从而使各个组织可以通过虚拟化和软件定义存储和网络连接来降低他们的数据中心的复杂度。
超融合架构的痛点
超融合架构的演进也面临诸多挑战。超融合架构所面临的挑战之一是它改变了扩展的活力。计算和存储的基本元素不再能够各自独立地扩展。其结果是,扩展只能是通过增加新的节点来实现,这又引入了新的瓶颈。
超融合应用要求多个百万级的IOPs的存储性能来应对高强度的输入输出负荷量。然而,现有的固态硬盘技术是建立在基于NAND Flash闪存的。而NAND Flash闪存引入了显著的延迟 -– 一次读操作的延迟可以达到100微秒到200微秒。为了克服NAND Flash闪存带来的束缚,IT架构师们开发了各种技术,如通过分割跨越多个NAND Flash闪存元器件进行数据存储访问的方式进行大的并行和分布式负荷处理,来弥补这些缺陷。现在这些服务器正在向超融合迈进。要想突破NAND Flash闪存对应用所带来的限制,挑战是巨大。
ReRAM为数据中心带来的革命性突破
新兴技术,如阻性存储器(ReRAM)正在进入市场。它将把访问延迟大幅度降低到10微秒以下,从而使如超高速的NVMe SSD等新产品成为可能。如果设计人员利用存储器的物理接口而不是PCIe接口,延迟还能更进一步降低。存储设备将会基于NV-DIMM存储器总线,其提供的延迟将会低于微秒级的范围。
当ReRAM在性能和功耗方面的的显著的优势会被应用到整个系统性能方程式的存储部分。这个新的产品分类还将要求在CPU/计算一侧也能展现出一个全新的面貌。系统资源将会被存储的输入输出持续地消耗掉。这就要求要有一个新的架构,来确保计算能力能够满足应用和网络接口的需求,并在保持低功耗的同时和实现高带宽。
图1描述了计算/存储侧瓶颈的一个事例。在这里,绝大多数的资源被分配到了存储的输入输出,以至于对于应用和网络接口,没有足够的计算能力。在一个高端CPU中,需要大约3.3个满时间负荷运行的核来管理1 MIOPS的NVMe设备。这需要支付昂贵的功耗和成本预算。如果应用750k IOPS的SSD固态硬盘,一个典型的2U服务器集成了24个这样的固态硬盘,应用需要一个高深度队列,达到18MIOPS。因此,仅仅是为了管理输入输出,就需要18 x 3.3 = 60个核,也就是一个基于4-CPU的高端架构的75%的资源。如图1所示。在对IOPS需求要跨越网络的情况下,相关的吞吐量在18M x 4096 x 8 = 600Gbit/s的范围,这对应了15个40GbE端口。
图1 基于Flash闪存的18M IOPS的NVMe存储系统
ARM RISC CPU的应用为管理输入输出提供了充足的计算能力,同时还能保持低功耗以及为应用和网络驱动提供足够的带宽。通过NVMe或NV-DIMM存储器件,把Crossbar的ReRAM技术和ARM RISC CPU结合起来,成功地应对IOPS的需求和功耗。假定ARM RISC CPU将会在64核、4存储器通道下具备合理的功耗预算,我们估计一个超融合节点将会在100W的功耗范围内达到12.5 MIOPS(图2)。因为访问一个DIMM接口比访问一个PCIe设备简单,我们有理由估测存储软件驱动将会比NVMe的驱动执行得更快,每个核将会达到1MIOPS的输入输出管理能力。因为外形尺寸小,在一个2U机柜里可以集成大约20个这样的节点,实现一个250MIOPS、2kW功耗预算的2U超融合服务器。
图2 12.5MIOPS的超融合节点
在这种情况下,跨越网络所得到的IOPS有着非常高的带宽:250M x 4096 x 8 = 8Tbit/s,甚至仅需要18%的CPU资源被用作输入输出的管理。
回到用户层面,以一个虚拟化用例作为例子,这样的一台服务器可以并行(3000 IOPS/VM)执行83,000个虚拟机(VM)。而在现有的一个集成了24个基于Flash闪存的2.5″ 固态硬盘(每个固态硬盘有750k IOPS)的2U超融合服务器上,仅能执行6,000VMs,这样需要14个这样的服务器来执行相同的VM数。Crossbar ReRAM提供了15倍的I/O性能密度(高至125MIOPS/U)和服务器层级的性能效率(125k IOPS/W)。
图3 超融合服务器上83000虚拟机
对于相同的VM数,由于集成度更高的解决方案在提供相同性能的情况下占用了更少的空间、消耗更少的功耗、需要更少的软件许可,用户将会收益于TCO的减少。
表1
为实现Tb/s的网络接口,在计算/网络一侧需要做一些R&D的工作;而在软件一侧,需要做一些R&D的工作来减少存储驱动的执行时间,为此,Crossbar ReRAM开启了更小的I/O(512B甚或更低的I/O, 参见表1),可用于大数据分析和OLTP数据库应用,从而在服务器中实现高达1 GIOPS/U。
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
作者简介:
Sylvain Dubois是Crossbar, Inc. 战略市场及业务拓展副总裁。他于2013年加入Crossbar管理团队并任职战略市场及业务拓展副总裁。他有着17年的开云棋牌官网在线客服领域的业务拓展和战略产品市场方面的经验。其在市场趋势分析、寻求新的可盈利的商业机会、以及创建精准的产品定位以完美地与市场需求同步、驾驭具有领导地位的市场占有率和商务成果等方面的能力得到广泛认可。
Sylvain Dubois获得了E.S.I.E.E. (Paris), University of Southampton (UK) and Universidad Pontifica Comillas (Spain)的微电子技术的硕士学位。