寒武纪推出思元270云端AI芯片,性能比上代提高4倍
2019-06-22
2019年6月20日,寒武纪宣布推出第二代云端AI芯片思元270(MLU270)及板卡产品,目标是提供速度更快、功耗更低、性价比更高的AI加速解决方案。思元270芯片采用TSMC 16nm工艺制造,其板卡产品可以通过PCIe接口快速部署在服务器和工作站内。
寒武纪本次公开的思元270板卡产品面向人工智能推断任务,在ResNet50上推理性能超过10000fps。MLU270-S4 型板卡(半高半长)面向数据中心部署,集成16GB DDR4 内存,支持ECC;MLU270-F4型板卡(全高全长)采用主动散热设计,面向非数据中心部署场景,集成16GB DDR4 内存,支持ECC。面向人工智能训练任务的思元270训练版板卡产品将于本年度第四季度推出。
思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。思元270芯片处理非稀疏深度学习模型的理论峰值性能提升至上一代MLU100的4倍,达到128TOPS(INT8);同时兼容INT4和INT16运算,理论峰值分别达到256TOPS和64TOPS;支持浮点运算和混合精度运算。
官方表示,寒武纪在定点训练领域已实现关键性突破,思元270训练版板卡将可通过8位或16位定点运算提供卓越的人工智能训练性能,该技术有望成为AI芯片发展的重要里程碑。在系统软件和工具链方面,思元270继续支持寒武纪Neuware软件工具链,支持业内各主流编程框架。此外,为方便开发者更好地挖掘思元270超强的运算能力、开拓更多的应用领域,寒武纪将在近期向社区和开发者开放专用编程语言。
寒武纪的人工智能处理器已经在智能手机中大规模出货,在云端产品方面,寒武纪去年5月推出第一代云端AI芯片MLU100及板卡于2018年5月发布。MLU100系列产品已为客户在智能视频分析、语音合成、推荐引擎、AI云等多个领域提供了高能效比的解决方案。
寒武纪表示,此次推出中文品牌“思元”是对MLU品牌的有机补充,其含义为“思考的基本单元”。思元商标的字体来自于中国元代书法家赵孟頫。
寒武纪是AI芯片领域的独角兽,2018年6月,寒武纪宣布完成数亿美元的B轮融资,投后整体估值达25亿美元。