1 / 59
文档名称:

基于无词典分词的中文生物医学文献相关性数据库构建方法研究.pdf

格式:pdf   页数:59
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于无词典分词的中文生物医学文献相关性数据库构建方法研究.pdf

上传人:quality 2014/3/30 文件大小:0 KB

下载得到文件列表

基于无词典分词的中文生物医学文献相关性数据库构建方法研究.pdf

文档介绍

文档介绍:北京协和医学院;中国医学科学院
硕士学位论文
基于无词典分词的中文生物医学文献相关性数据库构建方法研

姓名:王军辉
申请学位级别:硕士
专业:情报学
指导教师:胡铁军
20090605
摘要关性数据库的构建方法进行了大量的研究,但中文自动分词方法和文献相关性判定的时间复杂度两大问题,仍有待深入探讨。本研究针对中文自动分词问题,尝试引入一种基于重现原理的无词典分词方法,通过对分词结果的分析,初步证实了该分性判定时间复杂度问题,尝试提出“,基于生物医学文献相关性数据库的相关文献检索对于满足医疗卫生领域临床、教学和科研人员的知识需求有重要意义。中国医学科学院医学信息研究所近年来对中文生物医学文献相词方法在中文生物医学文献相关性数据库构建过程中应用的可行性;针对文献相关的速度,为中文生物医学文献相关性数据库的应用实践做了技术上的铺垫。最后,通过相关准率、蚉鲋副甑淖酆掀琅校砻鞅狙芯恐谢谖薮实浞执构建的文献相关性数据库在相关文献揭示的整体效果上,达到了和原来基于词典分词构建的中,证实了基于无词典分词构建中文生物医学文献相关性数据库的可行性。关键词:文献相关性数据库无词典分词相关文献检索文本相似计算倒排档‘基于无词典分词的中文生物医学文献相关性数据库构建方法研究》
,:,.甋,瑆瓼,‘基于无词典分词的中文生物医学文献相关性数据库构建方法研究’,瓼瓼瑆
独创性声明学位论文版权使用授权书本学位论文作者完全了解叭K芤教猛泄乇4妗⑹褂醚宦畚牡墓芾戆阅。本人授权勘π芤教媚揽梢越宦畚牡娜ú炕虿糠帜谌荼嗳胗泄厥菘饨本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成成果,也不包含为获得其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。果。论文中除了特别加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究学位论文作者签名:签字日期:年月日法。有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ导师签名:学位论文作者毕业后去向:工作单位:通讯地址:电话:邮编:
刚青,凡∞郧鹩氪车男畔⒆科学技术的发展日新月异,科技文献在数量上呈指数增长的同时,在内容上却大型的文献数据库检索系统仍沿用布尔运算模型,不能定量反映出用户需求与检出文献,以及文献与文献之间的相关程度。因此,如何增强检索结果的相关性,使用户方便快捷地获得最需要的信息,成为文献数据库检索系统建设过程中必须要着力它不仅可以完善文献检索系统的功能,提高检索结果的相关性,还能简化检索过程,以为知识服务的开展提供一个整合的资源平台。因此,构建文献相关性数据库,增国外的系统已经实现了基于文献相关性数据库的相关文献检索功能,数据库的问题,进行了深入的理论探讨和应用研究,并成功构建了实验性的中国生本研究针对第一个问题,尝试引入一种基于重现的无词典分词方法,在数据测试的基础上,分析其在构建中文生物医学文献相关性数据库过程中应用的可行性;针对第二个问题,在原有““倒排.,尝试探讨文献相关性判定时间复杂度问题的解决方案。最后,将本研究中基于无词典分词构建的文献相关性数据库,与原有基于词典分词构建的中国生物医学工程文献相关性本论文共分五个章节。第一章对相关文献研究,特别是相关文献检索进行了详细论述;第二章介绍了相关文献算法的演变以及国内文献相关性数据库建设研究进展;第三章对基于重现的无词典分词方法进行了应用研究;第四章探讨了将无词典分词的结果应用于生物医学文献相关性数据库构建过程中的可行性;第五章对本研究的主要工作进行总结,并展望了下一步的工作设想。日趋交叉分散,这对文献数据库检索系统的建设提出了更高的要求。然而当前许多解决的一个问题。文献相关性数据库织方式,可以定量地揭示文献间的内容相关关系,在内容上对相关文献进行集中。方便一般用户的使用。更重要的是,通过形成相互关联、内容广泛的知识网络,可强对文献内容的组织和管理,是提升图书情报领域知识服务水平的有效途径之一。生物医学文献相关性数据库的构建对满足医疗卫生领域临床、教学和科研人员的知识需求具有重要意义。并在使用过程中通过逐步完善获得巨大成功。以为参照,中国医学科学院医学信息研究所鲁埔娇圃盒畔⑺针对如何在中文环境中构建医学文献相关性物医学工程文献相关性数据库。但目前仍存在两个主要问题制约了研究成果在中国生物医学文献数据库械氖导视τ茫菏紫龋延醒芯烤揽看实浣蟹执剩需要对词典进行不断的更新