文档介绍:硕士学位论文
基于社会兴趣聚类的协同过滤推荐算法研究
RESEARCH ON COLLABORATIVE FILTERING
MENDER ALGORITHM BASED ON
SOCIAL INTEREST CLUSTERING
赵凯
哈尔滨工业大学
2012 年 6 月
国内图书分类号: 学校代码:10213
国际图书分类号: 密级:公开
管理硕士学位论文
基于社会兴趣聚类的协同过滤推荐算法研究
硕士研究生: 赵凯
导师: 芦鹏宇副教授
申请学位: 管理学硕士
学科: 管理科学与工程
所在单位: 经济与管理学院
答辩日期: 2012 年 6 月
授予学位单位: 哈尔滨工业大学
Classified Index:
:
Dissertation for the Master Degree in Management
RESEARCH ON COLLABORATIVE FILTERING
MENDER ALGORITHM BASED ON SOCIAL
INTEREST CLUSTERING
Candidate: Zhao Kai
Supervisor: Associate Prof. Lu Pengyu
Academic Degree Applied for: Master of Management
Speciality: Management Science and Engineer
Affiliation: School of Management
Date of Defence: June, 2012
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学管理学硕士学位论文
摘要
互联网的软件的发展和硬件性能的提升,为电子商务发展提供了很好的支
撑。与此同时电子商务网站用户面对的信息越来越多,海量的商品信息使得用
户获取满足自己需求的商品和信息难度增大,这就使得用户面临着严重的“信
息超载”和“选择障碍”问题。搜索引擎的出现在一定程度上能够解决用户面
临的信息超载问题,但是通过搜索引擎获取信息这一过程是大众化的,这种大
众化信息无法满足用户个性化的需求,用户需要电子商务网站能够根据他们的
喜好向其给出其可能感兴趣的商品的推荐。
推荐算法应运而生,其中运用最为广泛的是协同过滤推荐算法。协同过滤
推荐算法主要是根据用户对商品的评分信息给出推荐,因此忽略了比较重要的
UGC(用户产生内容),如:标签、评论等重要信息,然而已经存在的相关研
究很少有同时从标签语义和社区的角度来分析问题。本研究旨在综合利用评分
和标签两方面的信息来给用户产生个性化推荐,同时考虑到现实生活中用户的
社区性,分析和挖掘用户的社会兴趣,利用评分信息和用户评分类型信息来计
算用户的相似度,深入分析标签信息来挖掘用户的社会兴趣,根据用户的社会
兴趣将用户进行聚类,再根据基于社会兴趣的聚类结果,结合本文提出的推荐
算法提出了基于社会兴趣聚类的协同过滤算法。从理论上,该算法能够一定程
度的提高推荐的准确度。
本文使用 Movielens 电影数据集对本文推荐算法的推荐的质量和传统的推
荐算法进行比较,选取 MAE(平均绝对偏差)和 RMSE(均方根偏差)作为
推荐质量的评价标准,对本文提出的算法进行试验,得出试验结果,并对得出
的试验结果进行深入分析,进而得到本文的最终研究成果,同时根据研究成果
和模型的存在的问题做出总结。
关键词:电子商务;用户产生内容;推荐;社会兴趣;聚类
- I -
哈尔滨工业大学管理学硕士学位论文
Abstract
With the development and upgrading of software and hardware, it
provides an excellent platform for the boom of merce. Meanwhile, it lead to
merce users facing more and more vast amounts of information, including
product information, and custom’s review an