1 / 77
文档名称:

基于潜在语义相关算法的电子病历检索的研究和应用.pdf

格式:pdf   页数:77页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于潜在语义相关算法的电子病历检索的研究和应用.pdf

上传人:beny00001 2016/3/2 文件大小:0 KB

下载得到文件列表

基于潜在语义相关算法的电子病历检索的研究和应用.pdf

相关文档

文档介绍

文档介绍:独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢=此思0学位论文作者签名:疑寿.,日期:硼y、f、订学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年d一年半口两年口学位论文作者签名:欠乐导师签名:曾看q≯签字目期:加17,:如,.≯厂万方数据东北大学硕士学位论文摘要基于潜在语义相关算法的电子病历检索的研究与应用摘要随着我国医保建设的快速发展,医院信息化系统开发的不断深入,电子病历作为临床医疗信息基础,逐渐成为现代化医院综合信息系统的核心。电子病历对病人的病情等信息进行了详细而完整的记录,它能够帮助医疗人员更好地在临床上进行决策。现今,电子病历在临床诊断与治疗中的应用日益广泛,以此同时,也产生了大量的电子病历数据。如何有效地利用这些电子病历数据辅助医生进行疾病诊断与医学研究是一个非常重要的问题。面对现代医院产生的大型电子病历数据,如何快速准确地检索得到医疗人员所需要的电子病历已成为一个巨大的挑战。然而,应用到电子病历检索的传统关键词检索或者向量空间模型都存在着一定的缺陷,如不能很好的解决医学词汇的同义性问题(如发热与发烧),以及医学词汇的多义性,这种情况的出现,很大程度上影响了电子病历检索的性能。因此,针对医疗领域电子病历的特点建立一个具有检索智能性的电子病历系统就显得尤为重要。鉴于医学词汇间的同义性和单个医学词汇的多义产生的歧义性,本文主要分析了两种智能型信息检索方式:潜在语义分析(LatentSemanticAnalysis,LSA)和概率潜在语义分析(ProbabilisticLatentSemanticAnalysis,PLSA)。它们将信息检索从机械匹配关键词的层面提高到了语义(概念)的层面,从概念意义上来认知和处理检索用户的请求,本文的主要贡献如下。~个较为完善的电子病历检索相关测试集,这个相关测试集是电子病历检索性能评价所必不可少的,但是目前国内还没有一个标准的电子病历检索相关文档测试集合可供实验使用,因此本文对该语料库进行了构建,且本文实验表明该语料库构建的很合理,本文研究的检索算法在该语料库上也得到了很好的评价。,实现了基于LSA的电子病历的检索。,实现了基于PLSA的电子病历的检索。,是通过对当前最优K值不断逼近来实现的,替代了传统的穷举选择法,本文实验验证了本文所述方法在K值选择的效率优于已有的PLSA算法,并且其选择出来的隐含主题数K值也比较合理。~种基于LSA和PLSA的组合算法的电子病历检索方法,该组合算法对万方数据东北大学硕士学位论文摘要基于LSA的电子病历的检索的相似度和基于PLSA的电子病历的检索的相似度进行混合相似度的计算。本文的实验表明,该方法有效地提高了电子病历的检索性能。关键词:电子病历;信息检索;潜在语义;主题模型;矩阵分解万方数据东北大学硕士学位论文AbstractResearchandApplicationofElectronicMedicalRecordsRetrievalBasedontheCorrelationAlgorithmofLatentSemanticAbstractWiththerapiddevelopmentofChina’Smedialinsurancebuildingandthedeepeningofthehospitalinformationsystemdevelopment,’-,