1 / 65
文档名称:

基于用户和资源权重的协同过滤推荐系统的研究与设计.pdf

格式:pdf   页数:65
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于用户和资源权重的协同过滤推荐系统的研究与设计.pdf

上传人:cherry 2014/2/17 文件大小:0 KB

下载得到文件列表

基于用户和资源权重的协同过滤推荐系统的研究与设计.pdf

文档介绍

文档介绍:武汉理工大学
硕士学位论文
基于用户和资源权重的协同过滤推荐系统的研究与设计
姓名:胡斌
申请学位级别:硕士
专业:计算机应用技术
指导教师:彭德巍
20090501
摘要随着网络的普及和信息服务的发展,信息服务系统在为用户提供越来越多选择的同对,其结构也变得更加复杂,用户经常会迷失在大量的信息空间中,无法顺利找到自己所需要的信息。推荐系统可以根据用户已有的记录信息,对目标用户所将感兴趣的信息进行推荐,可以更方便的帮助用户找到其所需的信息。随着商业信息化的发展,推荐系统在信息服务系统中的应用越来越广,所以提供准确而实时性的推荐系统将是加速当今信息产业化的重点目标。推荐系统通过预测用户对项目的喜好程度来为用户进行信息过滤,应用知识发现技术来生成个性化推荐。协同过滤是一种常用的减少信息过载的技术,已经成为了个性化推荐系统的一种主要技术,然两现有大多数协同过滤算法存在着几个主要问题:精确性,数据稀疏和冷启动问题。许多结合协同过滤与基于内容的信息过滤的算法可以解决这些问题,但是这些算法还不能很好的将用户的兴趣很好的表现出来,因此在很多时候推荐的结果并不能很好的满足用户的需要,而且在很多情况下,用户的兴趣是会随着时间的推移而发生变化的,所以,要想提高推荐的质量,就必须将用户的各个特征以及变化都相应的考虑进来;另外,不同的项目对于用户来说,是具有不同的价值的,而这些价值是可以从用户的评分信息中进行挖掘的。因此,资源本身的价值也可以成为我们对项目进行推荐的一个重要因素。如何提高推荐质量是本研究的目标,由于推荐质量的精确性从很大程序上取决于近邻用户的选取,所以要提高推荐质量,用户相似性的精确度就必须得到提高,同时也是本研究的重点。本文的研究主要是在用户信息相对完整的情况下,将用户的部分特征与资源权重相结合,提出了一种基于用户和资源权重的推荐方法,在传统的推荐方法上做了相应的改进。本文所做的主要研究以及创新性主要体现在以下几个方面:,建立相应的矢量空间模型,在本研究中主要包括用户特征模型和用户项目模型。在传统的协同过滤技术的基础上,引入了时间函数,考虑了用户兴趣变化对用户间的相似性影响,并根据项目本身所体现的价值,设计出一个基武汉理笱妒垦宦畚
于用户特征以及项目特征的算法,利用该算法计算出用户间的相似性,形成相根据相似用户集中的用户信息,使用改进的协同过滤算法对用户未评分生的变化,并平稳的考虑了资源自身的权重,对最终的预测有一定的提高。增关键字:协同过滤;个性化推荐;时效性;相似用户集似用户集。的项目进行评分预测,然后根据评分预算结果由高到低的顺序向用户推荐指定数量的项目。本文的创新点主要是在传统的协同过滤算法的基础上,将用户特征和资源权重相结合,对传统的算法作了进一种改进,能更好的适应用户兴趣随时间而发强了推荐的精确性和时效性。武汉理工大学硕士学位论文
甌洳锄琒瑃甜瓾耐鷓糟粕齮..猯瓹琣籌瑀.’甌胏..篴.,鮡甧.,
琣.,瑆...,.琧,:籭;;瑂·
研究生┟:—婢日期:』州饵坞帆—卅鸷虹导师┟:独创性声明学位论文使用授权书其他人已经发表或撰写过的研琉成果,也不包含为获得武汉理工大学或其他教本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方以外,论文中不包含育机构的学位或证书而使用过的材料,与我一同工作的同志对本研究的任何贡献均已在论文中作了明确的说明并表示了谢意。本人完全了解武汉理工大学有关保留、使用学位论文的规定,即:学校有和借阅。本人授权武汉理工大学可以将本学位论文的全部内容鳊入有关数据库进行检囊,可以采用影印、缩印和其他复制手段保存或汇编本学位论文。同时授权经武汉理工大学认可的有关机构或论文数据库使用或收录本学位论文,并C茏寐畚脑谵得芎蠓炊菔卣爵露权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅向社会公众提供信息服务。研究生┟:
⒐赜胄畔⒐随着信息高速公路的发展和普及,人们已经被包围在信息的汪洋大海之中。对于系男畔⒍裕唤鍪呛A康模移渥槭兑彩且旃沟摹⒍嘣7植的,随着信息的不断更新和增加,信息量更是以指数的形式增长,因而形成了“信息爆炸”。对于一般的用户来说,“信息迷航”和“信息过载”已经成为先益严重的问题。信息迷航是指浏览者在复杂的网状信息空间中迷失航向,不知道自己所处在信息空间中的位置,无法返回到某个节点,以至于迷失了他们的目标。信息过载则是由于提供的信息的复杂性和广泛性,并且限于浏览者的知识水平与认识能力,造成浏览者无法正确理解和使用信息【俊解决此类问题的关键在于怎么样将颖欢邮懿饫勒叩那肭笞;主动探知浏览者的信息需求,实现网络信息系统对浏览者的主动服务。新一代的信息服务将主要体