1 / 4
文档名称:

推荐系统算法总结.docx

格式:docx   大小:15KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

推荐系统算法总结.docx

上传人:guoxiachuanyue009 2022/8/25 文件大小:15 KB

下载得到文件列表

推荐系统算法总结.docx

相关文档

文档介绍

文档介绍:推荐系统算法总结
作者:阿俊发布于:2011-11-2919:08Tuesday分类:推荐系统
最近看推荐系统方面的东西也有段日子了,有书,博客,唯独没有看论文。
总感觉论文对于工业界来说用处真的不如学校做课题、论文那么大,只要知道某的资讯,通过文本分析那一套算法提取出每篇资讯的关键词,以及统计频次和逆向文档频率来聚类或者笨一点地话计算出资讯的相似度矩阵,即共同的keywords越多,两篇资讯的相似度越高。当你的用户很少很少,你的显式反馈数据非常非常少的时候,你可以根据用户的浏览或者搜索等等各种行为,来给用户进行推荐。再猥琐一点的话,你可以在用户刚刚注册好你的应用的时候,给他一些提问,比如让他输入一些感兴趣的话题啊,或者对以前看过的电影打分什么的。(当然这些电影都是你从各个簇中随机选取的,要足够多样性)这个算法它好就好在,不需要拿到用户
--项目的评分矩阵,只需要知道用户喜欢什么,就可以很快速地推荐给用户十分相关的item。这个算法需要每天都要根据你抓取的资讯,不断地计算item之间的相似性。这个算法有个好处在于可以从容应对上面的两个算法其实都很难应对的问题,就是如果你想推出一个新的item,因为没有一个人有对这个newitem的评分,所以上述的两个算法不可能推荐新的东西给你,但你可以用基于内容的算法将新的item计算出它属于哪个类,然后时不时地推出你的新item,这点对于商城尤其重要。
4、slopeone
推荐系统的最最本质的事情就是把user-itemrating矩阵中的空白填好,看穿这个本质以后,你可能会觉得问题一下子简单多了,填格子啊?填格子谁不会啊。因此很多高效加搞笑的算法就出来了。slopeone就是其中,说实话,这个算法我自己没有写过,但是看到这个算法怎么实现的,我就觉得应该很好做,而且算起来会很快,但结果肯定不会特别理想。
SlopeOne的基本概念很简单,例子1,用户X,,Y还对Item2打了分,用户A对Item2可能会打多少分呢?
User
RatingtoItem1
RatingtoItem2
X
5
3
Y
4
3
A
4
?
根据SlopeOne算法,应该是:4-((5-3)+(4-3))/2=.
当然这个只是个算例简单地说明下原理,当user和item都很多的时候,你可以用加权的办法来做。
为什么我会感觉这个算法的效果会不理想呢?
因为,这个算法总是把你的口味和大众的平均口味作对等,推荐出来的东西很难是非常个性化的。很容易让很多用户的推荐结果趋向一致,也就是大数的平均值,也即大众的平均口味。
5、svd
svd的全称是:SingularValueDecomposition,翻译过来是奇异值分解,是一种矩阵分解的方法。其实,这个方法是提取一般实矩阵“特征值”的算法,(这里特征值加引号是因为,特征值是针对方阵来定义的,而一般的m*n的实矩阵是没有特征值的。)其实,矩阵就是一个线性变换的表示方法,因为一个向量乘一个矩阵的结果是一个向量,第一个向量通过线性变换来变成第二个向量。线性变换有许多变换方向,比如你可以对一个图像矩阵做伸缩同时也做平移。那么特征值和特征向量又是什么?一个特征向量就是表示其中的一个变换方向,而对应的特征值则表示