华为Atlas 900 AI集群获奖 性能超50万台PC
2020-02-27
来源:网易科技
2月26日,华为宣布其研发的Atlas 900 AI集群日前获得了Global Mobile Awards 2020 (GLOMO奖项)未来技术大奖,它是目前全球最快的AI训练集群,使用了华为自研的7nm昇腾910处理器。
本次GLOMO奖项未来技术大奖由GSMA组织方首次设定,旨在表彰超越时代、重塑世界的技术。
华为表示,Atlas 900 AI集群夺得本届GLOMO未来技术大奖,标志着业界对其在人工智能领域技术创新的高度肯定。
Atlas 900是目前全球最快的AI训练集群,它由1024颗昇腾910 AI处理器构成,其总算力可达256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。
据了解,昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌和英伟达。昇腾910半精度(FP16)运算能力为256TFLOPS,比NVIDIA的Tesla V100要高一倍,整数精度(INT8)512TOPS,支持128通道全高清视频解码(H.264/265),设计功耗350W(实测达到规格算力仅310W)。
在ResNet-50的模型训练基准测试中,Atlas 900以59.8秒的成绩打破世界纪录,是业界唯一能在一分钟内完成训练的产品。
它可广泛应用于科学研究与商业创新,让研究人员更快的进行图像、视频等AI模型训练,让人类更高效的探索宇宙奥秘、预测天气、勘探石油,加速自动驾驶等商用进程。
Atlas 900 AI集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,基于CloudEngine系列数据中心交换机,打造百TB全互联无阻塞专属参数同步网络,降低网络时延,参数同步时延缩短10%~70%,使得AI模型的训练过程更加高效。
在散热方面,华为为Atlas 900 AI集群打造出了业界顶尖的散热系统。它采用混合液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑超过95%的液冷占比。单机柜支持高达50kW的超高散热功耗,实现PUE低于1.1的极致数据中心能源效率。
与此同时,与8kW风冷机柜相比,可节省79%的机房空间。极致的液冷散热技术满足了高功率、高密设备部署、低PUE的需求,极大地降低了客户的TCO。