1 / 33
文档名称:

基于领域知识库的信息推荐系统-智能文本篇章分析_毕业设计论文.doc

格式:doc   页数:33
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于领域知识库的信息推荐系统-智能文本篇章分析_毕业设计论文.doc

上传人:追风少年 2013/7/13 文件大小:0 KB

下载得到文件列表

基于领域知识库的信息推荐系统-智能文本篇章分析_毕业设计论文.doc

文档介绍

文档介绍:2013届毕业论文
----智能文本篇章分析
题目:基于领域知识库的文本信息推荐系统

学院: 数学科学学院
专业:信息与计算科学
时间: 2013 年5月
摘要
上成千上万的信息过载而设计的一种智能的代理系统,上大量的信息中向特定用户自动推荐符合其个人兴趣偏好或需求的信息,从而实现个性化的推荐服务。基于领域知识库的信息推荐即是根据知识点之间的相关性和用户的兴趣来向其推荐用户感兴趣的信息,推荐信息包括个人热点推荐和公共热点推荐。本项目需要解决的主要问题有如下三个方面:
第一、建立用户兴趣模型并进行动态更新。建立用户兴趣模型,首先,要收集用户的行为数据,其方式主要有显式和隐式两种;其次,用基于向量空间模型(VSM)来表示用户的个人兴趣;最后,处理用户浏览记录挖掘用户感兴趣的知识点的关键词,通过回溯用户所有关键词的生成算法动态建立用户兴趣知识库。
第二、对文本篇章进行智能分析。首先,需要建立领域的知识库,并且人为设定每两个个知识点之间的相似包含关系;其次,从网页HTML源文件中提取文章的标题和正文,用正则表达式匹配的方法获取标题,用分块提取汉字的思路分析提取出文章正文,剔除图片、贴吧、广告等;最后,将提取出的文章进行分词和评分。
第三、依据用户个人的兴趣知识库产生推荐信息。产生推荐信息,首先,系统通过搜索引擎自动搜索用户关键词,从搜索结果中提取有效的网页地址;其次,二次访问获得的有效网页,进行文本篇章智能分析,通过评分情况判断是否推荐。
测试结果表明,本项目已经能够很好地依据用户的个人兴趣实现个性化的文章信息的推荐,并且通过处理用户浏览过推荐网页来挖掘用户潜在的兴趣,从而实现用户兴趣知识库的动态更新。至此,推荐系统核心功能的框架已经基本搭建完成,为以后扩展至更多的领域的研究打下了坚实的基础。
关键词:推荐系统用户兴趣模型智能文本篇章分析推荐信息
Abstract
mendation system is an intelligent agent system solving thousands of overloading information from the . It can offer plenty of special information automatically to individuals with different demands and interests, and thus making the personalized mendation service plished. Based on domain knowledge, the information mendation could offer users interested messages according to the connection of knowledge points and personal appetites. mendation system has two aspects, including the mendation of personal hotspot mon hotspot. This project will solved three primary problems.
User’s interests model and dynamic renovation.
To build user’s interests model, firstly data of user’s behaviors including explicit aspects and implicit aspects should be collected. And secondly, use vector space model to express the user's personal interests. Finally, by exploring the browsing history and searching keywords of user’s interests and backtracking all the keywords of user by generating algorithm Knowledge-base of user's interests are dynamically setup.
Text intelligent analysis.
Firstly, building domain knowledge base, and setting up the relationship between two points artificial