文档介绍:提 要
推荐系统,作为当前电子商务系统的重要模块,正逐渐渗透入人们的日常生活,
成为改善用户网络体验的关键角色。而协同过滤技术以其简单、高效的特点,成为目
前最成功、应用最广泛的推荐技术。
本文首先分析了三种常用的相似性度量方法(余弦,修正余弦,Pearson 相关系
数)在两种传统 K 最近邻(K Nearest Neighbors, KNN)算法(user-based 和 item-based)上
的表现。针对稀疏性问题和相似性度量方法的弊端提出了改进因子 CP (Cosine-Pearson)
和 NG (Neighbor Grade,近邻等级),针对冷启动问题提出了非个性化改进因子 CR
(Common Ratings, 公众评分)。将三种改进因子分别应用于两种传统算法上,都取得
了一定的改进。将 CP、CR 及两种传统算法相融合取得了较好的改进。
本文还将 SVD 模型与基于内存的 K 最近邻算法相结合(SVD-KNN),实现了两个
模型的互补。通过将 CP 和 CR 分别应用在 SVD-KNN 上,并将 SVD-KNN 的实验结
果与基于原始数据的 KNN 的结果进行比较,可以分析出 SVD 模型在协同过滤中有如
下表现:在一定程度上缓解了数据稀疏性;保持了数据的基本特征;造成部分数据丢
失及精度下降。
目 录
第 1 章 绪 论 ............................................. 1
推荐系统的产生和发展 ................................... 1
推荐系统的工作机制 ................................. 1
协同过滤技术面临的挑战 ................................. 2
协同过滤技术的研究现状 ................................. 4
基于内存的协同过滤 ................................. 4
基于模型的协同过滤 ................................. 5
基于矩阵分解的协同过滤 ............................. 5
基于多种方法的融合式协同过滤 ....................... 6
本文内容安排 ........................................... 6
第 2 章 传统ITEM-BASED协同过滤推荐算法 ..................... 7
传统算法概述 ........................................... 7
协同过滤推荐过程 ................................... 7
传统Item-Based协同过滤算法 ......................... 8
传统Item-Based算法复杂度分析 ....................... 9
相似性度量方法 ......................................... 9
最近邻的选取 .......................................... 10
推荐的产生 ............................................ 12
本章小结 .............................................. 13
第 3 章 传统协同过滤推荐算法改进 ............................ 14
相似性度量方法分析 ................................