基于浮栅器件的低位宽卷积神经网络研究
所属分类:技术论文
上传者:zhoubin333
文档大小:450 K
标签:卷积神经网络量化存算一体
所需积分:0分积分不够怎么办?
文档介绍:浮栅器件(Flash)能够将存储和计算的特性相结合,实现存算一体化,但是单个浮栅单元最多只能存储位宽为4 bit的数据。面向Nor Flash,研究了卷积神经网络参数的低位宽量化,对经典的AlexNet、VGGNet以及ResNet通过量化感知训练。采用非对称量化,将模型参数从32位浮点数量化至4位定点数,模型大小变为原来的1/8,针对Cifar10数据集,4位量化模型的准确率相对于全精度网络仅下降不到2%。最后将量化完成的卷积神经网络模型使用Nor Flash阵列加速。Hspice仿真结果表明,相对于全精度模型,部署在Nor Flash阵列中的量化模型精度仅下降2.25%,验证了卷积神经网络部署在Nor Flash上的可行性。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。
Baidu
map