1 / 72
文档名称:

基于SVM算法的本体实例分类改进的研究.pdf

格式:pdf   页数:72
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于SVM算法的本体实例分类改进的研究.pdf

上传人:2028423509 2014/5/4 文件大小:0 KB

下载得到文件列表

基于SVM算法的本体实例分类改进的研究.pdf

文档介绍

文档介绍:基于惴ǖ谋咎迨道分类改进研究杭州电子科技大学硕士学位论文研究生:路前教授指导教师:王晓耘
產够厂:.,
酗銎赚论文作⋯:略‰杭州电子科技大学日期:≯年三月日期:砂/甏踉耭珀学位论文原创性声明和使用授权说明日期:餖年;月嗳原创性声明学位论文使用授权说明得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写申请学位论文与资料若有不实之处,本人承担一切相关责任。本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。C苈畚脑诮饷芎笞袷卮斯娑本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文论文作者签名:指导教师签名:
要摘信息技术和牟欢系姆⒄梗唤龃戳俗芰可系摹靶畔⒐亍蔽侍猓一褂薪构性的“信息短缺约案髦帧靶畔⑾葳濉薄ⅰ靶畔⒚晕怼钡任侍猓沟没袢√囟ㄐ畔⒌哪讯不断加大,因此,有学者提出知识工程的思想来专门研究如何有效地对知识进行处理。知识工程主要包括知识表示、知识获取以及知识管理三个基本课题,其中知识表示是知识工程的核心。研究发现,本体能够很好的表示领域知识,并且能够提供计算机能够理解的形式化语义信息,促进计算机之间的通信和互操作,让计算机模拟人脑的功能准确地、自动地对信息进行处理。本体自动扩充是当前本体研究的热点问题,所谓本体自动扩充是指自动地对语料进行处理,从中抽取出本体概念实例,在实例与本体概念之间建立关系,最终建立起本体种群。本体自动扩充研究中最关键的部分是本体实例的分类,即通过特定的分类算法计算实例与概念之间的相似度,一方面把识别出的本体实例填充到相应的本体概念当中去,另一方面尽可能多的识别出本体概念的实例,提高本体实例分类的准确率和召回率。目前,本体实例分类的研究主要通过借鉴人工智能、机器学习等领域的研究方法进行研究,所应用到的方法主要有两类,一类是基于规则的方法,这种方法通过构建实例识别、分类的规则来实现本体的自动扩充。另一种基于统计的方法,通过标注语料训练或自学习的方式建立统计模型,进而利用该模型抽取本体概念实例实现本体自动扩充。作为在人工智能、机器学习等领域的研究中广泛应用的算法之一一一支持向量机算法,能够被用来解决本体实例的分类问题。支持向量机且恢窒蛄靠占淠P,它把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,通过计算向量之间的相似性实现实例的分类。本文提出了一种惴ǖ母慕P图碠瓸P停饕J钦攵許算法难以解决多类分类问题以及特征向量构造难度大两方面的问题进行改进。本文的改进策略主要体现在两个方面:第一,利用本体自身的概念结构和二叉树模型组织嗬喾掷嗥鳎箂算法适合解决本体实例的分类问题。第二,利用本体自身所蕴含的语义信息构造特征向量,选取分类效果更好的元素作为特征向量的维度。改进后的模型能够更好地处理有限样本数据的分类问题。本文设计了四组实验方案,实验结果表明,.模型分类的准确率和召回率都有大幅度的提高。关键字:本体自动扩充,惴ǎ咎迨道掷啵J冻槿。卣飨蛄杭州电子科技大学硕士学位论文
出锄畁锄肌·’.”,“锄肌甋刑缸缈篎,“鷗甜,’,百甜百耐呐科琲簍鄐竚総竚押孤蛅衄鰊倒玱,〈·,耤甋礶“.緀餭,,簎,。瞣産瑆订舔,甀—.—矗,痑,琫琲....。仃琣