文档介绍:基于本体的企业文本检索模型研究摘要企业中的文本随着企业的不断发展而呈现爆炸式的增长,如何在海量数据中检索需要的文本是企业知识管理中的一个重要的研究课题;而本体提供对某个领域知识的共同理解,提供基于语义的知识获取和共享,因此可以借助于本体,通过定义和共享共同的领域知识来促进用户和信息服务器对领域知识的共同理解,提高知识检索的层次,以提高文本检索的查准率和查全率。本文首先研究分析了本体的概念、分类、功能、描述语言、理论和应用研究现状,并把目前的文本信息检索技术分成了四个流派,综合分析比较了目前文本信息检索技术的原理、优缺点;然后具体研究分析了目夯于本体的信息检索方法研究的现状,针对其不足之处提出了一个基于本体的企业文本检索模型。在这个模型中,本文提出了以文本自然段作为检索对象,通过信息抽取以本体描述符来表示文本自然段和检索要求,重点研究了领域本体建设方法、本体描述符相似度的计算、文档模糊聚类分析,并在其后给出了相似度和模糊聚类分析的计算实例。关键词:文本检索,本体描述符,领域本体,语义相似度,文档聚类
..珼,,;琣甋,琧,,
磊暂咨嗨А菪畚名拟伽九嚣、净梭.‰%勃合肥工业大学答辩委员会签名:ぷ鞯ノ弧⒅俺委员:本论文经答辩委员会全体委员审查,确认符合合肥工业大学硕士学位论文质量要求。主席:导师:
插图清单图论文的组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图语义逑到峁埂图本体的语言栈⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图诒咎宓钠笠滴谋拘畔⒓焖骺蚣堋图畔⒓焖鞯牟街琛图诒咎宓奈谋拘畔⒊槿∧P汀图本体片断⋯..⋯⋯⋯⋯.⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..
表格清单表本体代表性的定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表概念元特性的说明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表语义鞑忝枋觥表镆逋缯弧佑镅浴表骷际趿髋商氐惚冉稀表准主题词表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表
导师躲埸踢弘、辛回学何论文作者签字:弘串\宫签字日期:≯丽年乡月衫日签字日期:细歹年∥月/签字日期:≯疥年,月/占日学位论文版权使用授权书独创性声明金卫』些厶堂金胆』些厶堂阅。本人授权金罡至、业盘堂本人声明所呈交的学位论文是本人在导师指导械难芯縏作及取得的研究成果。据我所知,除了文中特别加以标志和敛谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得或其他教育机构的学位或证书而使用过的材料。与我一同鞯耐径员狙芯克龅娜魏喂毕拙在论文中作了明确的说明升表示谢意。本学位论文作者完全了解有关保留、使用学位论文的规定,有权保留并向国家有关部或机构送交论文的复印件和磁盘,允许论文被查阅或借可以将学位论文的全部或部分论文内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷躥潦视帽臼谌ㄊ学伉论文者签名学位论文作者毕业后去向鞯ノ通讯地址邮编电话
致谢本论文是在导师梁昌勇教授的悉心指导下完成的,不论从选题还是从论文的撰写、定稿都得到了梁昌勇教授的谆谆教诲,使我在学业上有了长立了典范。值此论文完成之际,谨向导师致以崇高的敬意和衷心的感谢感谢管理学院老师蒋翠清、余本功、俞家文、丁勇、陆文星、何宏贵、左春荣、杨昌辉等老师对我的关心和指导。我完成了学业。感谢对论文进行评审和提出宝贵意见的各位老师。最后,感谢所有关心和帮助过我的人们。足的进步,尤其是导师渊博的学识、严谨的学风、求实的态度都为学生树在读研的三年里,我得到了陈增明、黄永青、杨国兰、童建军、张俊岭、万会奇等同学的关心和帮助,在此对他们表示感谢。感谢我的父母和家人,正是他多年来默默的支持和无私的关怀,使作者:张申恒年
第一章绪论企业文本信息检索系统的现状和发展趋势信息检索指的是从一个文档集合中查找出包含有与用户的信息需求相关的信息内容的文档或者文本。而企业文档信息检索对于企业知识管理无疑是非常重要的。闖在文档方法论中提出了关于文档的五条公理⋯:冷公理一、文档记录了企业知识;夺公理二、文档定义了企业工作流程夺公理三、文档为管理人员提供事实;夺公理四、文档构建计算系统;令公理五、文档引导企业变化;这充分说明了文档在企业运作中的重要性。牡捣椒廴衔#企业中的文档中包含了整个企业大部分的知识和关于企业经营情况的事实,因而它们对于企业来说是非常宝贵的资源,这些资源必须要能及时准确地提供给需要这些知识和事实的人。奈牡捣椒刍谷衔#唤企业中充斥这大量的文档,这些文档还在处于不断的运动变化中。一方面体现在文档总是处于动态的工作流程之中,学要随着工作流程的进展在不同的部门之间发送,另一方面是文档本身处于不断的创建、发布、评审、修订的过程中,文档本身的内容也在不断变化。企业信息系统历经了电子数据处理系统,管理信息系统,决策支持系统,知识管理系统几个发展阶段,其中一条根本原