1 / 10
文档名称:

一种改进的协同过滤推荐算法.doc

格式:doc   大小:18KB   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种改进的协同过滤推荐算法.doc

上传人:neryka98 2021/11/23 文件大小:18 KB

下载得到文件列表

一种改进的协同过滤推荐算法.doc

文档介绍

文档介绍:精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 2 页
一种改进的协同过滤推荐算法
  摘要:协同过滤算法自提出以来便得到了广泛运用,但协同过滤算法本身具有的数据稀疏性及冷启动问题也制约了算法的性能。通过分析协同过滤算法的原理和不足,提出了一种改进协同过滤算法的思路,并在MovieLens数据集上进行了验证,一定程度上提高了算法性能。
  关键词关键词:推荐系统;协同过滤;数据稀疏性
  中图分类号:TP312
  文献标识码:A 文章编号:1672-7800(2016)004-0063-03
  0引言
  网络技术的迅猛发展使得互联网上的信息呈现爆炸式增长,为人们的生活和学****提供了便利,与此同时,海量的数据也带来了一些问题,其中最主要的就是“信息过载”问题。所谓信息过载问题,是指由于不相关的垃圾数据过多从而导致用户无法准确找到自己想要信息的问题。
  为应对信息过载问题,人们提出了各种解决方案,其中最为用户所熟悉的无疑是搜索引擎技术。但搜索引擎的服务是被动的,它要求使用者必须先给出一个搜索关键字,然后才能提供与该关键字相关的信息。这种完全依赖于关键字的服务模式要求用户能用关键字准确描述自己所需信息,否则无法提供服务,但是现实中用户很多时候并不能精确描述自己的需求信息。这种情况下,以推荐系统为代表的技术可以较好地解决该问题,提高用户的使用体验。
精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 2 页
  1协同过滤算法
  
  “协同过滤”技术最早由GlodBerg等于20世纪90年代提出,该技术最初被用来过滤电子邮件[1],此后这种技术取得了商业上的巨大成功,得到了广泛使用[2-3]。协同过滤的基本思想是,如果两个用户在一些项目上具有相似的评价信息,包括显示的直接评分信息或者点击、购买等隐式评价信息,则这两个用户具有相似兴趣。一般而言,协同过滤需要使用到的用户评价信息会被存储在一个数据表中,该表可以被称为用户评分矩阵。
  协同过滤技术的关键在于计算两个用户或者项目的相似度,然后根据相似的用户或者项目进行推荐。其中如果根据某一用户的评分数据寻找到与其相似的用户,并依据相似用户的爱好对活动用户进行推荐的思想被称为基于用户的协同过滤。如果知道用户对某一项目评分较高,则可以根据评分矩阵寻找与这一项目相似的项目推荐给用户,这种思想被称为基于项目的协同过滤。
  两种协同过滤算法的基本步骤比较相似。首先,依据用户对物品的评分建立用户评分矩阵,矩阵的行数为系统中用户的数量,列数为系统中物品的数量,没有评分数据的默认为零;然后依据用户评分矩阵计算相似度,目前比较主流的相似度计算方法有余弦相似度和Pearson相关系数。
精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 3 页
  余弦相似度:将某一用户的评分看作1个N维向量,用户之间的相似度是通过用户的评分向量间夹角的余弦来计算,夹角越小则相似度越高,余弦向量相似度计算公式如下:
  
  协同过滤技术是目前最成功的推荐技术,尽管这种技术在商业上取得了巨大成功,但该技术依然有一些关键技术点有待改进。相对于其它各种推荐技术,协同过滤的最大优点在于这