飞腾携手宝德、比特大陆推出全国产 AI 计算平台解决方案,助力 AI+落地应用
2020-07-31
来源:飞腾PHYTIUM
加速AI算法,实现多场景应用
全国产 AI 计算平台解决方案搭载飞腾高性能处理器和比特大陆最新深度学习加速卡,基于宝德AI 服务器进行架构,计算性能业界领先,特别适用于超大运算规模的深度神经网络的推理运算,可实现对诸如视频结构化、人脸识别、物品识别、视频内容增强等典型的 AI 运算进行加速。例如,接收采集前端传送的视频流与图片流等信息,利用人工智能算法进行智能分析,进而将分析结果传递给下一环节的应用平台进行处理,以实现基于 AI 的场景业务应用。
典型方案组网示意图
全国产 AI 计算平台解决方案适合用在基于深度学习技术实现的各种 AI+行业场景的 AI 加速推理,包括互联网、智慧警务、智慧交通、智慧城市、智慧社区、智慧零售、工业智能、智慧医疗等 AI+落地场景。
多样化应用场景
四大优势赋能千行万业
飞腾联合宝德和比特大陆推出的全国产 AI 计算平台解决方案,具有自主安全、性能领先、工具链完善、业务全流程加速四大鲜明优势,为各行各业搭上 AI 快车充分赋能。
自主安全
飞腾 CPU 处理器和比特大陆算丰 TPU 处理器都是自主研发的芯片,具备完整的自主知识产权和后续迭代开发能力,可以对各类项目提供长期安全可靠的最底层硬件资源支撑。
性能领先
该解决方案搭载的飞腾 FT-2000+/64 处理器是飞腾面向高性能服务器领域的产品,实测性能达到了国际主流服务器 CPU 同等水平,填补了国产高端通用 CPU 领域的空白,是中国首款自主设计的 64 核通用 CPU,也是国际上首款兼容 ARMv8 指令集的 64 核通用 CPU。
比特大陆 SC5+ 人工智能加速卡是基于 BM1684 芯片的第三代量产产品,成熟度稳定度更高。该加速卡同时支持 FP32 和 INT8 等多种精度计算,SC5+ 三芯片卡可提供强劲的近 100 路视频硬解码能力,内存容量可达 36GB/48GB,单卡配置 96MB 高速缓存 SRAM,小尺寸模型计算可大幅提速,多项指标在国内同类产品中居首,在同等运算数精度下的计算性能超越国际同类主流产品。
搭载飞腾 FT-2000+/64、比特大陆 SC5+ 人工智能加速卡的宝德高性能 AI 服务器,具备业界领先的高算力密度、高能效比、低功耗等突出特点。
工具链完善
比特大陆工具链经历了多年的技术打磨与沉淀,具备业内领先的完善与成熟度,对开发人员友好易用,可实现快速上手,能很大程度上节省算法迁移工作量和成本。工具链支持包括 Caffe、TensorFlow、Pytorch、Mxnet、Darknet、PaddlePaddle 在内的业内主流深度学习框架,涵盖了神经网络推理阶段所需的模型优化、高效运行时支持等能力,为深度学习应用开发和部署提供易用、高效的全栈式解决方案。
业务全流程加速
SC5+ 加速卡具备视频解码、图像解码、视频编码、图像编码、视频前后处理、AI 推理运算加速、数据加密安全引擎等多个计算加速单元,可以对 CV 视觉业务的全流程数据加工、计算、压缩/解压缩、加解密等进行逐个环节的运算加速增强,减少甚至摆脱对主机计算资源的占用,减少数据搬运次数,提高业务效率,增强整体 AI 计算服务器的可靠性和鲁棒性。
该解决方案相关产品
宝德:BD-21083F2 高性能机架式服务器
宝德 BD-21083F2 机架式服务器是基于国产飞腾处理器 FT-2000+/64 设计开发,同时搭载多张比特大陆 SC5+ 加速卡,整体采用国产自主固件和国产自主 Linux 操作系统,成为整体方案高性能、高稳定、高可靠的平台保证。
宝德BD-21083F2服务器
该服务器可支持 10 个热插拔 2.5 英寸或 3.5 英寸 SATA/SAS/SSD 硬盘三种存储方案。整机结构采用模块化设计方案,主机处理器模块、系统电源模块、系统风扇可快速免工具拆装,具有结构紧凑可靠、便于扩展、便于维护等优点。面向党政和国家重点行业信息系统和业务系统应用需求,具有高吞吐率、单线程能力强、整数计算性能高、访问和 IO 通道带宽高等特点,能满足相关应用需求,可以用于各种人脸识别、视频结构化、视频转码处理、安防监控、机器视觉、高性能计算环境,实现对多种 CNN/RNN /DNN 等神经网络模型的高性能推理运算。
比特大陆:算丰 SC5+ 加速卡
在该方案中搭载比特大陆(BITMAIN)推出的最新一代深度学习加速卡 SC5+,来实现对多种 CNN/RNN /DNN 等神经网络模型的计算加速。
比特大陆SC5+加速卡外观
比特大陆 SC5+ 加速卡内置 3 颗 BM1684 TPU 处理器,为标准 PCIe 3.0 接口,采用无风扇设计,可提供高达 105.6T INT8 算力,以及 6.6T FP32 算力,可支持高精度计算。其中,BM1684 TPU 处理器采用特别优化过的脉动阵列架构,在进行深度学习推理时,具有业界领先的利用率。SC5+ 加速卡可以用于各种人脸识别、视频结构化、安防监控、人工智能、机器视觉、高性能计算环境,用户可以通过 BITMAIN 同步提供的工具链软件,实现对多种 CNN/RNN /DNN 等神经网络模型的计算加速。
比特大陆SC5+加速卡配置