基于改进VGG16的猴子图像分类方法
《信息技术与网络安全》2020年第5期
田佳鹭,邓立国
摘要:为提高对细粒度图像分类的准确性和分类速度,提出基于改进VGG16和迁移学习的图像分类方法。首先从kaggle平台中获取十种不同猴子数据集,并对数据集进行标准化处理,包含图片去椒盐噪声、将数据集转换为TensorFlow中提供的统一TFRecord数据格式。然后迁移学习改进的VGG16卷积神经网络,模型的优化包括利用Swish作为激活函数、将softmax loss与center loss相结合作为损失函数以实现更好的聚类效果、采用性能完善的Adam优化器。用训练集训练模型以确定微调参数信息,再用测试集检验模型准确性。结果表明,该方法对猴子图像分类的准确度可达到98.875%,分类速度也得到了显著提升。与其他传统卷积神经网络模型相比,该方法具有更高的准确性和适用性。
中图分类号:TP391.41;TP18
文献标识码:A
DOI:10.19358/j.issn.2096-5133.2020.05.002
引用格式:田佳鹭,邓立国.基于改进VGG16的猴子图像分类方法[J].信息技术与网络安全,2020,39(5):6-11.
引用格式:田佳鹭,邓立国.基于改进VGG16的猴子图像分类方法[J].信息技术与网络安全,2020,39(5):6-11.
Abstract:
Key words :
随着深度学习技术的不断进步,对于通用对象的类别分析,卷积神经网络已经达到了很高的水平,但对于细粒度图像分类的稳定性目前还有待提升。所谓细粒度图像分类,通常用于描述对同一类事物进行细致的划分,所以待分类图像的区别要更加精准,类内区别大而类间区别小,粒度则更为精细。本文方法基于改进的VGG16深度卷积神经网络。尽管原始的VGG16模型已经拥有了良好的普适性和实用价值,并且在各种图像分类和目标检测任务中都体现了极佳的效果,通过迁移学习改进的VGG16模型,能够将已习得的特征和性能应用到待解决的问题中,极大地节省了训练时间。此外在硬件上选取GPU进行训练,使得速度得到进一步提升。为了改善原始的交叉熵损失函数无法保证提取的特征具有识别度的缺点,在VGG16模型中引入将center loss损失函数与交叉熵损失函数相结合的办法。此外还运用了新型的Swish激活函数,以及拥有自适应学习率的Adam优化器。最后利用不同种类的猴子训练集对改进的模型重新训练,以获得少量微调的参数信息。经验证该方法对猴子图像识别的精准度可提升到98.875%,而原始的VGG16模型在该数据集上的分类仅能达到90.210%的准确率,可以证明改进后的模型具有更好的识别效果。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003088
作者信息:田佳鹭,邓立国(沈阳师范大学 数学与系统科学学院,辽宁 沈阳 110034)
此内容为AET网站原创,未经授权禁止转载。