文档介绍:动态推荐系统中的协同过滤算法研究
重庆大学硕士学位论文
(学术学位)
学生姓名:白培发
指导教师:王成良教授
专业:计算机软件与理论
学科门类:工学
重庆大学计算机学院
二 O 一三年五月
Research on Collaborative Filtering
Algorithm in Dynamic mender
System
A Thesis Submitted to Chongqing University
in Partial Fulfillment of the Requirement for the
Master’s Degree of Engineering
By
Bai Peifa
Supervised by Prof. Wang Chengliang
Specialty: Computer Software and Theory
College puter Science of Chongqing University,
Chongqing,China
May, 2013
重庆大学硕士学位论文中文摘要
摘要
随着互联网和信息技术的高速发展,互联网上的信息急剧膨胀,造成了信息
过载问题,导致用户很难从海量信息中获取自己所需要的信息。如何快速有效地
帮助用户找到所需的信息、解决信息过载问题引起了学术界和工业界的广泛关注。
在这种驱动下,推荐系统应运而生。推荐系统是一种智能化、个性化的信息服务
系统,是处理信息过载的有效工具。推荐系统研究的一个核心是推荐算法的研究。
协同过滤算法作为目前应用最成功的推荐算法之一,成为推荐系统领域的一个研
究重点,在该算法基础上衍生出了许多优秀的改进算法。但早期对协同过滤算法
的研究大多是在基于系统的静态模式下进行,忽略了实际系统的动态性,导致实
际应用中推荐系统的推荐质量随时间的推移逐渐下降。
本文在研究已有协同过滤算法及其各种改进算法的基础上,对动态推荐系统
中的协同过滤算法进行研究,其主要研究内容有:
①传统的基于项目的协同过滤算法忽略用户类别信息,只用单一全局的相似
度来衡量项目间的相似性,这可能导致计算出来的相似度很高的项目对于目标用
户来说与目标项目并不相似。针对这个问题,本文提出了多相似度的基于项目的
协同过滤算法。该算法将每两个项目在每个用户类别中都建立一个独立的相似度,
再将目标项目在目标用户所属的每个用户类别中的预测评分进行加权得到最终的
预测评分。
②实际的推荐系统是动态变化的,用户兴趣会随着时间发生变化。为了能及
时准确地捕捉用户兴趣的变化,本文将时间信息引入到协同过滤算法中,同时考
虑到了用户评分频率对用户兴趣变化的影响,提出了一种时间和评分频率加权的
协同过滤算法。最后将多相似度的基于项目的协同过滤算法与时间和评分频率加
权的协同过滤算法相结合,提出了多相似度的时间和评分频率加权的协同过滤算
法。
③本文采用 MovieLens 站点提供的数据集,通过实验对本文提出的协同过滤
算法进行评估,验证其合理性和有效性。实验结果表明,相比传统的基于项目的
协同过滤算法,多相似度的基于项目的协同过滤算法在评分预测的准确率方面有
一定程度的提高;同时相比静态模式的协同过滤算法,考虑系统动态性后的协同
过滤算法可以有效提高推荐的质量。
关键词:推荐系统,协同过滤,个性化推荐,信息过载,时间效应
I
重庆大学硕士学位论文英文摘要
ABSTRACT
With the rapid development of and information technology, the amount of
information rapidly expand, which causes the problem of information overloading. As a
result that, it is hard for the users to find the information they need from the massive
information. How to help users find the needed information quickly and effectively, and
resolve the problem of information overload has aroused widespread con