kaiyun官方注册
您所在的位置: 首页> 通信与网络> 设计应用> 基于VGG16网络的人脸情绪识别
基于VGG16网络的人脸情绪识别
2022年电子技术应用第1期
蔡 靖,杜佳辰,王 庆,周泓任
吉林大学 仪器科学与电气工程学院,吉林 长春130026
摘要:近年来,如何通过人工智能对人的面部表情进行识别分析成为一个研究热点,利用人工智能可以快速地分析人的面部情绪,并以此为基础进行进一步研究。在深度学习中,传统的卷积神经网络存在对面部表情特征的提取不充分以及计算机参数量较大的问题,导致分类准确率较低。因此,提出了基于VGG16网络的人脸表情识别算法,通过与InceptionV3、InceptionResNetV2、ResNet50等模型实验对比,结果表明,VGG16神经网络在FER2013PLUS测试数据集上的识别准确率为79%,准确率比传统的卷积神经网络高。
中图分类号:TP183;TP391.41
文献标识码:A
DOI:10.16157/j.issn.0258-7998.211516
中文引用格式:蔡靖,杜佳辰,王庆,等. 基于VGG16网络的人脸情绪识别[J].电子技术应用,2022,48(1):67-70,75.
英文引用格式:Cai Jing,Du Jiachen,Wang Qing,et al. Facial emotion recognition based on VGG16 network[J]. Application of Electronic Technique,2022,48(1):67-70,75.
Facial emotion recognition based on VGG16 network
Cai Jing,Du Jiachen,Wang Qing,Zhou Hongren
College of Instrumentation & Electrical Engineering,Jilin University,Changchun 130026,China
Abstract:In recent years, how to recognize and analyze people′s facial expressions through artificial intelligence has become a research hotspot. Using artificial intelligence can quickly analyze people′s facial emotions, and further research is carried out on this basis. In deep learning, the traditional convolutional neural network can not extract facial expression features sufficiently, and the amount of computer parameters is large, which leads to low classification accuracy. Therefore, a facial expression recognition algorithm based on VGG16 neural network is proposed. Compared with the model experiments of InceptionV3, InceptionResNetV2 and ResNet50, the results show that the recognition accuracy of VGG16 neural network on FER2013PLUS test data set is 79%, which is higher than that of traditional convolution neural network.
Key words :deep learning;convolutional neural network;emotion recognition;VGG16

0 引言

Hinton等人在研究深度卷积神经网络中通过引入ReLU函数以及采用多GPU训练等方式加快了网络的训练速度并提高了网络模型的准确率[1]。LeCun等人表明深度学习通过使用反向传播算法来发现大型数据集中的复杂结构,以指示机器应如何更改用于从前一层的表示计算每一层的表示的内部参数。深度卷积网络在处理图像、视频、语音和音频方面取得了突破性进展,而递归网络则为文本和语音等顺序数据带来了光明[2]。随着科学技术,尤其是计算机技术方面的不断进步,人们对卷积神经网络的研究也不断深入,面部表情识别技术也随之得到了发展。同时,一些问题也随之而来,例如:如何提高面部表情分类的准确率,如何能够在保证准确率的前提下减少计算的参数量等。

Tang等人[3]提出将卷积神经网络(Convolutional Neural Networks,CNN)中融入支持向量机(SVM),同时修改了全连接层中的计算损失值的方法,在表情数据集上的测试结果为71.2%,斩获了当年Kaggle比赛的一等奖。崔凤焦[4]将卷积神经网络、Adaboost和支持向量机3种模型算法结构进行相互比较和设计优化,在Cohn-Kanade表情库中实现了对人脸情绪的智能识别,平均识别率最高达到了74.92%。谢鑫等人[5]采用了耗时加长的杜鹃算法(CuckooSearch,CS)对ResNet50模型进行了变更改进,提高了准确率并使算法不会在调参时陷入梯度消失或爆炸的问题,准确率达到了74.3%。陈佳等人[6]提出一种基于卷积神经网络集成的表情识别方法,子网结构在第一阶段训练3个子网络,采用Batch Normalization方法和Dropout层来加速网络的收敛。接着去掉3个子网络的输出层,使用SVM进行第二阶段的训练,完成最终表情的预测,其准确率达到了70.84%。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003910




作者信息:

蔡 靖,杜佳辰,王 庆,周泓任

(吉林大学 仪器科学与电气工程学院,吉林 长春130026)




wd.jpg

此内容为AET网站原创,未经授权禁止转载。
Baidu
map