文档介绍:中国协和医科大学(北京协和医学院)
硕士学位论文
构建面向知识服务的医学文献相关性数据库方法研究
姓名:余希田
申请学位级别:硕士
专业:情报学
指导教师:李丹亚
20080501
图中国生物医学工程文献相关性数据库建设流程图⋯⋯⋯⋯⋯⋯图中国生物医学工程文献相关性检索系统中的原文献和相关文献⋯..图字符串“的后缀树表示⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图添加“钡牡个字符“笔钡睦┱共僮鳌图添加“的第鲎址癰”时的添加操作⋯⋯⋯⋯..图添加“的第鲎址癮”时的断开操作⋯⋯⋯⋯..图为字符串“惫菇ê笞菏鳌图在表示字符串“钡暮笞菏魃喜檎易址癮薄图删除字符串“钡牡谝桓龊笞骸癮”⋯⋯⋯⋯⋯⋯.图基于后缀树算法的医学文献相关性数据库建设流程图⋯⋯⋯⋯.图南椎亩嘣W哟硎尽图籰相关准率频数分布图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图相关性判定时间频数分布图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图目录图在表示字符串“钡暮笞菏魃咸砑幼址癰薄《构建面向知识服务的医学文献相关性数据库方法研究》
表目录表相关准率专家判定表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表相关准率的猄检验结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表相关文献构成比菘釨表相关性判定时间表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表相关性判定时间的玈检验结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表数据库胧菘釨的比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表相关文献一致率表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.《构建面向知识服务的医学文献相关性数据库方法研究》
独创性声明学位论文版权使用授权书本学位论文作者完全了解立坯塑匡堂暄阅。本人授权塞边塑医堂瞳可以将学位论文的全部或部分内容编入有关数据库进行本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。论文中除了特别加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包含为获得其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:签字冢年月日有关保存、使用学位论文的管理办法。有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ导师签名:签字同期:签字日期:学位论文作者毕业后去向:工作单位:通讯地址:电话:邮编:
摘要究所近年来对构建面向知识服务的医学文献相关性数据库进行了大量的研究,已经为了进一步提高现有文献数据库的知识服务水平,中国医学科学院医学信息研探索出一套较为成熟且实用的基于词表分词的文献相关性判定算法,并基于此算法成功构建了中国生物医学工程文献相关性数据库。该数据库的文献相关性判定结果已具备较高的准确率,但在应用上受制于基础词表。因此,本论文在深入探讨基于词表分词算法的中国生物医学工程文献相关性数据库的基础上,采用不基于词表分词的后缀树算法,初步构建了医学文献相关性数据库,并将此方法与基于词表分词的构建方法进行了全方位的比较。本论文共分七个章节。第一章分别介绍了知识服务的内涵、特点,以及文献相关性数据库建设研究涉及的概念,并简单论述了二者之问的关系;第二章概述了文献相关性数据库的国内外研究进展,其中重点介绍了中国医学科学院医学信息研究所近年来有关文献相关性数据库的建设研究概况;第三章详细介绍了基于词表分词算法的医学文献相关性数据库的构建概况;第四章重点论述了基于后缀树算法的医学文献相关性数据库的建设过程;第五章通过数据测试、分析,评价了基于后缀树算法的医学文献相关性数据库的相关性判定效果;第六章比较了词表分词算法与后缀树算法在构建医学文献相关性数据库时的优缺点;第七章就面向知识服务的医学文献相关性数据库的进一步研究提出了几点建议。关键词:知识服务文献相关性数据库相关性判定后缀树《构建面向知识服务的医学文献相关性数据库方法研究》
《构建面向知识服务的医学文献相关性数据库方法研究》瑆琣瓾,.,.,,甌,.,:,
把知识服务随着科学技术的飞速发展,海量的信息和知识己成为社会发展的催化剂和经济增长的基础,也成为推动社会和经济发展的主要动力。为了记录和传播这些知识,国内外相继涌现出了大量的文献数据库,如⒅形目萍计诳菘狻⒅泄期刊网等。这些文献数掘库虽然资源量丰富,检索手段多样,但是大部分数据库的检索效率却不能尽如人意,检索结果不能充分满足广大用户的知识需求。因此,如何提高文献数据库的知识组织和知识服务水平,如何增强检索结果的相关性,已成为图书情报领域迫切需要解决的问题之一。目前,国内对构建面向知识服务的医学文献相关性数据库的研究还处于起步阶段。其中,中国医学科学院医学信息研究所经过多年的努力,探索出一种基于词表分词和特征项抽取的相关性判定算法,并运用该算法成功构建了中国生物医学工程