引用格式:刘超慧,韩传福,陈天成,等.融合惩罚因子和时间权重的协同过滤推荐算法[J].信息技术与网络安全,2020,39(5):17-21.
随着互联网技术的发展和移动终端设备的普及,以用户为核心的信息生产模型造成了信息的爆炸式增长,公众很难在海量信息中迅速、准确地找到所需的信息,面临着严峻的“信息过载”问题。以推荐系统为代表的信息过滤技术,是解决“信息过载”问题的常用方法。推荐系统依据用户的历史行为和数据,通过建立模型来挖掘用户需求和潜在兴趣,进而从海量信息中为用户筛选所需的信息[1]。
协同过滤算法是众多推荐算法中使用最广泛、最有效的算法之一,已成功应用于许多商业推荐系统,但其仍存在着一些亟待解决的问题,例如冷启动、数据稀疏和马太效应。对此许多学者进行了卓有成效的研究工作。于洪等人提出基于时间窗口的时间数据权重,将用户兴趣分为长期和短期两类,更好地反映出了用户兴趣变化规律,提高了推荐精度[2];赵文涛等人提出基于时间的Logistic权重函数与用户特征属性进行加权的新的相似度度量模型[3];兰艳等人利用衰减因子建立非线性时间加权函数,赋予评分不同的时间权重,提高了推荐的准确性[4]。上述文献虽然考虑了用户兴趣随时间的变化,却未注意到热门物品对用户评分的影响,对推荐精度有一定的影响。
谢修娟等人引入物品流行度与位置信息,提高了推荐结果的多样性[5];孙红等人通过添加物品热门惩罚因子,优化了皮尔逊相似度计算,提高了推荐质量[6];AHM H J等人通过研究物品热门程度的影响,使用启发式算法对用户相似性度量进行优化,缓解了传统协同过滤算法的冷启动问题[7];焦富森等人考虑物品质量和用户评分倾向性对用户打分的影响,提高推荐效果[8]。这些算法虽弥补了传统算法过分考虑热门物品对评分的影响,却未考虑用户兴趣随时间迁移的情况,无法动态追踪用户的兴趣变化。
本文在基于皮尔逊相似度的基础上进行改进实验,提出了一种融合物品热门惩罚因子和时间权重的相似度计算方法,弥补了传统算法的缺陷。在Movies100k数据集上进行实验,实验结果显示融合后的算法可以有效追踪用户兴趣的变化和降低热门物品对用户评分的影响,提高推荐精度。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003098
作者信息:刘超慧,韩传福,陈天成,孔先进(郑州航空工业管理学院 智能工程学院,河南 郑州 450046)