文献标识码:A
DOI:10.16157/j.issn.0258-7998.211516
中文引用格式:蔡靖,杜佳辰,王庆,等. 基于VGG16网络的人脸情绪识别[J].电子技术应用,2022,48(1):67-70,75.
英文引用格式:Cai Jing,Du Jiachen,Wang Qing,et al. Facial emotion recognition based on VGG16 network[J]. Application of Electronic Technique,2022,48(1):67-70,75.
0 引言
Hinton等人在研究深度卷积神经网络中通过引入ReLU函数以及采用多GPU训练等方式加快了网络的训练速度并提高了网络模型的准确率[1]。LeCun等人表明深度学习通过使用反向传播算法来发现大型数据集中的复杂结构,以指示机器应如何更改用于从前一层的表示计算每一层的表示的内部参数。深度卷积网络在处理图像、视频、语音和音频方面取得了突破性进展,而递归网络则为文本和语音等顺序数据带来了光明[2]。随着科学技术,尤其是计算机技术方面的不断进步,人们对卷积神经网络的研究也不断深入,面部表情识别技术也随之得到了发展。同时,一些问题也随之而来,例如:如何提高面部表情分类的准确率,如何能够在保证准确率的前提下减少计算的参数量等。
Tang等人[3]提出将卷积神经网络(Convolutional Neural Networks,CNN)中融入支持向量机(SVM),同时修改了全连接层中的计算损失值的方法,在表情数据集上的测试结果为71.2%,斩获了当年Kaggle比赛的一等奖。崔凤焦[4]将卷积神经网络、Adaboost和支持向量机3种模型算法结构进行相互比较和设计优化,在Cohn-Kanade表情库中实现了对人脸情绪的智能识别,平均识别率最高达到了74.92%。谢鑫等人[5]采用了耗时加长的杜鹃算法(CuckooSearch,CS)对ResNet50模型进行了变更改进,提高了准确率并使算法不会在调参时陷入梯度消失或爆炸的问题,准确率达到了74.3%。陈佳等人[6]提出一种基于卷积神经网络集成的表情识别方法,子网结构在第一阶段训练3个子网络,采用Batch Normalization方法和Dropout层来加速网络的收敛。接着去掉3个子网络的输出层,使用SVM进行第二阶段的训练,完成最终表情的预测,其准确率达到了70.84%。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003910。
作者信息:
蔡 靖,杜佳辰,王 庆,周泓任
(吉林大学 仪器科学与电气工程学院,吉林 长春130026)