文档介绍:中国科学技术大学
硕士学位论文
基于标签的协同过滤稀疏性问题研究
姓名:王金辉
申请学位级别:硕士
专业:管理科学与工程
指导教师:王卫平
2011-05-09
摘要
摘要
和电子商务的蓬勃发展,极大地拓展了用户选择商品的空间。但同时
也带来了信息过载(information overload)问题。用户在找到自己需要的商品之前,
往往需要浏览大量的无关信息。在这种情况下,电子商务推荐系统应运而生,它
通过对用户的兴趣爱好进行预测,为用户提供个性化的商品推荐服务。
协同过滤方法是一种面向用户行为的推荐技术,协同过滤方法通常在一个用
户项目评分矩阵上寻找当前用户的最近邻居,然后参考这些最近邻居的偏好,预
测当前用户的偏好,并向当前用户推荐一组其最有可能购买的商品。协同过滤方
法应用广泛,具有良好的推荐效果,但是面临稀疏性问题的挑战。
在协同过滤推荐系统中,用户对项目的评分存储在一个二维矩阵中,但用户
只对其中很少项目提供了评分值,随着用户数量和项目数量的迅速增加,矩阵中
大量甚至多数元素都为空,这就形成了用户评分稀疏矩阵。稀疏的用户评分矩阵
会从相似度计算、最近邻居选择和评分值预测等三个方面对推荐系统的推荐精度
产生负面影响。
论文在详细分析了协同过滤方法稀疏性问题的基础上,提出了基于标签和协
同过滤的混合推荐方法 TAG-CF 和改进的 TAG-CF,这些方法引入当前流行的标
签技术,将利用标签信息得到的用户评分值填充到稀疏矩阵中,形成相对密集的
虚拟评分矩阵,实验表明,论文提出的方法能有效提升推荐系统的性能。基于理
论研究成果,论文设计了基于统一框架的个性化推荐系统,并将不同的推荐方法
整合到这个框架中以满足不同用户在不同场景下的多样化需求。
关键词:推荐系统协同过滤稀疏性标签推荐系统架构
I
Abstract
Abstract
The rapid development of and merce has greatly
expanded the space for the user to select products. But also brought the
problem of information overload. Users have to navigate much irrelevant
information before finding the goods they need. In this case, merce
mendation system came into being, it forecasts the user's interests and
provides users with personalized product mendation service.
Collaborative filtering is a mend technology based on user
behavior. It typically use a user-item rating matrix to find the current user's
nearest neighbors, and then predict the current user’s preferences by
referring to these nearest neighbors’ preference, and mend a group of
products which are most likely to be bought by the current user. Although
collaborative filtering has been widely used and have excellent performance
in mendation, it is also facing the challenge of sparsity.
In collaborative filtering systems, the rating given by a user to an item
is stored in a two-dimensional matrix, but only very few users provide rating
to the system. With rapid increase in the number of users and items, a lot of
and even the m