比特大陆端和云AI芯片路线图透露的雄心
2018-10-21
随着应用要求的提升,以及技术的不断成熟,有越来越多的AI芯片开始落地,特别是在云端,AI专用ASIC正在逐步渗透进传统的x86处理器阵地,典型代表就是谷歌及其TPU,而在中国,也有一家公司,正在全发力专用的AI芯片,这就是一直处于舆论焦点的比特大陆。
长期以来,公众对于比特大陆的认知,主要停留在”矿机芯片龙头“层面,但自该公司传出 IPO 后,尤其是近期其IPO招股书所披露的消息,这家公司的AI 芯片业务正在成为业界关注的话题。
日前,比特大陆正式发布了终端人工智能芯片BM1880,一同发布的还有基于云端人工智能芯片BM1682 的算丰智能服务器SA3、嵌入式AI迷你机SE3、3D人脸识别智能终端以及基于BM1880的开发板、AI模块、算力棒等产品。
据悉,这家成立于2013年的公司,2015年就开始启动AI 芯片业务。比特大陆产品战略总监汤炜伟表示,2015年前后,业界普遍认识到通用处理器无法应对AI处理任务,并开始发力AI专属处理器。可见,比特大陆的AI芯片布局还是比较早的。
比特大陆最先推出的是云端AI芯片,也就是2017 年发布的第一代产品BM1680,又在今年第一季度推出了第二代的BM1682。此次又推出了终端侧的AI芯片BM1880。汤炜伟表示,比特大陆云端人工智能芯片以9个月速度快速迭代,基于芯片的相关产品在实际运行中表现良好,客户给出正面反馈,合作正在广泛展开,很多安防项目持续落地。同时,由于目标市场应用需要端云一体化的AI解决方案,为了更好的满足客户与市场的需求,我们决定开发并推出端侧的AI芯片及解决方案。
云端AI聚焦安防
云端AI芯片的应用场景可以分为四大类:安防,园区,智慧城市,互联网。其中,业界普遍认为最具应用潜力的就是安防,由于其市场广阔,应用落地也相对容易,就给了AI芯片足够大的发展空间。
比特大陆的BM1682芯片于2018年一季度量产发布,峰值算力达到3TFlops,功耗为30W,是该公司面向深度学习领域推出的第二代人工智能芯片,可脱离 X86 CPU 单独存在,支持客户二次开发,拥有单芯片八路H.264、H.265解码能力,支持视频图像后处理硬件加速,支持以太网、PCIE的多芯片互联,易于横向扩展;相比第一代拥有更高密度的特点,实际性能大幅提升。
图:第二代云端AI芯片BM1682
基于BM1682芯片,比特大陆研发了深度学习加速卡 SC3、智能服务器 SA3、人脸识别服务器 SS3-C3和嵌入式AI迷你机SE3等,可广泛应用于安防、互联网、园区等领域。
在发布会上,汤炜伟透露了下一代云端芯片BM1684的进展。BM1684预计在今年年底推出,采用12nm制程工艺(BM1680和BM1682采用28nm制程),性能将有大幅提升,基于此芯片的服务器SA5支持视频结构化路数也将大幅提升,远超同类产品。此外,在BM1684之后,该公司还将于2019年推出BM1686,预计会采用7nm制程。
基于,BM1682,比特大陆推出了自主研发的算丰智能服务器SA3。其中,SA3-23服务器为19英寸标准2U高度的高密度服务器,携带3个智能处理单元,每个单元含6颗BM1682。SA3主要有以下几点优势:
第一:高性能
SA3内部采用多个BM1682芯片的互联集群式架构,拥有低功耗的主控技术,提供集群管理、任务作业调度、负载均衡、视频图像API接口等服务,具备海量视频数据的并行计算能力,稳定、可靠、及时响应外界请求,具备可管理性。
第二:高能效比
基于BM1682的SA3服务器,相比传统厂商依靠GPU通用图形处理器而设计的服务器,具备更高的性能功耗比,使其在满足高性能视频分析的同时,降低了功耗,性能功耗比提升了2倍以上。
第三:高计算空间密度
智能服务器SA3在提供超强算力、降低整机功耗的同时,也大大降低了计算的空间密度。相比于行业算力相当的主流4U服务器,SA3所具有的2U高度,在实际的机房部署中占用更小的机柜空间,能让客户选择更灵活的部署方案,从而减少了在数据中心部署的总体拥有成本(TCO),达到为行业赋能的同时,降低使用成本。
值得一提的是,SA3视频结构化服务器(2U)能够支持的视频结构化路数达到90路,性能超过传统行业服务器(基于GPU)2.2倍;人脸识别方面性能达到传统服务器3倍(基于GPU)。
图:算丰智能服务器 SA3
比特大陆还在积极拓展智慧园区市场,基于BM1682 的嵌入式 AI 迷你机 SE3, 体积小巧,尺寸仅为210mm*115mm*45mm,其单精度峰值运算力可达 3 TFLOPS,额定功耗为 60W,单台设备便可支持4路动态或10路静态人脸识别,远超市场同类产品,受到客户广泛认可。
此外,基于BM1682,比特大陆还推出了3D人脸识别智能终端,具有极高的安全级别 提供3D人脸识别、声纹识别、语音识别等多重系统级生物识别验证技术, 解决传统生物识别技术因误识率高、非活体攻击,及防伪能力不足而产生的安全性问题,也是业内业界首款支持多模混合型生物识别的3D人脸识别智能终端。
图:3D 人脸识别智能终端
在研发、迭代芯片及相关产品的同时,比特大陆也在积极推动行业合作及项目落地。
在2018年百度AI开发者大会的AI Computing System论坛上,百度公司发布了其最新的AI 推理加速引擎——Anakin v0.1.0,比特大陆AI芯片BM1682运行Mobilenet时的latency数据在所有测试硬件中表现最优,其性能约为TensorRT或Anakin优化过的业内主流芯片的2-4倍。
2018年,比特大陆与福州市签署城市级战略合作协议,通过人工智能技术,助力福州的智慧城市、平安城市建设;比特大陆人工智能产品参与湖北省公安厅安防算法测试,测试结果位居第一;此外在其他省市的安防与人工智能项目中,比特大陆产品也有陆续落地。
在园区方面,比特大陆提供的人脸识别解决方案连续为“中国海峡项目成果交易会”以及“第20届中国国际投资贸易洽谈会”等大型展会服务,服务多达40万人次,在这样的“压力测试”中表现稳定可靠。目前,比特大陆AI+园区的产品与解决方案已经广泛应用于工厂、产业园、写字楼、新零售等多个场景,并与高端房地产公司密切合作。
首款终端AI芯片
满足多种应用场景需求
此次,比特大陆推出了其首款终端AI芯片BM1880,并基于此,一次性推出了多款用于边缘计算的AI终端。
BM1880 芯片于2018年7月成功流片,是一款聚焦于边缘应用的深度学习推理人工智能芯片,可为 8位整数运算提供1TOPS算力,在Winograd 卷积加速下,支持高达2TOPS@INT8,特殊设计的 TPU 调度引擎能有效地为所有的张量处理器核心提供极高的带宽数据流。芯片内含2MB内存, 可以为性能优化和数据重用提供最佳的编程灵活性。同时,BM1880也为用户提供了强大的深层学习模型编译器和软件SDK开发包,Caffe、Tensorflow等主流深层学习框架可以轻松地移植到 BM1880 平台上,常见的 CNN/RNN/ DNN 等神经网络模型也均可运行。
图:终端AI芯片BM1880
BM1880芯片可以作为深度学习推理加速的协处理器,也可以作为主处理器从以太网接口或USB接口接收视频流、图片或其它数据,执行推理和其他计算机视觉任务;其它主机也可以发送视频流或图片数据给BM1880,BM1880做推理并将结果返回主机。
据悉,在推出第一代终端AI芯片BM1880后,比特大陆将于2019年推出第二代产品BM1882,以及2020年的BM1884,按照规划,BM1882和BM1884的主要应用场景将是智能摄像机、智能机器人和智能家居等。
基于BM1880,比特大陆推出了算丰边缘计算开发板,专为各种需要强大深度学习能力的边缘计算应用而设计,利用其快速且完整的原型设计,可以迅速帮助开发者完成各种类型的应用程序开发。算丰边缘计算开发板内含BM1880芯片,同时支持 Arduino 和 Rasperry Pi 的开发模块。开发人员可以利用现成的模块来开发领先的深度学习或机器视觉相关应用程序,包括人脸检测和识别、脸部表情分析、物体检测和识别、车牌识别、声纹识别等。
图:边缘计算开发板
除此之外,比特大陆还设计了两款通过USB 界面、为各种边缘应用使用的AI模块和AI算力棒。两款产品均内含 BM1880芯片,通过USB接口,为传统产品增添 AI 功能,可应用于智慧工控机、机器人、工业计算机等产品上。
图:USB人工智能算力棒
由于AI 芯片的研发非常复杂,绝不是简单砸钱就能实现的,需要非常扎实的技术和人才积累。而比特大陆在加密货币挖矿芯片上的成功和积累,为该公司AI芯片发展提供了强有力的硬件技术支持。未来几年,比特大陆在AI专用ASIC领域及相关服务器等产品方面的表现很值得期待。