1 / 3
文档名称:

【医疗信息化】基于医院本体的医疗大数据的搜索与利用.pdf

格式:pdf   大小:569KB   页数:3页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

【医疗信息化】基于医院本体的医疗大数据的搜索与利用.pdf

上传人:破竹传道 2021/12/10 文件大小:569 KB

下载得到文件列表

【医疗信息化】基于医院本体的医疗大数据的搜索与利用.pdf

相关文档

文档介绍

文档介绍:基于医院本体的医疗大数据的搜索与利用
秦晓宏①
①上海柯林布瑞信息技术有限公司

近年来,随着医院信息化建设的不断发展 ,以及信息化管理和物联网的应用 ,医疗护理工作流程中产
生的数据越来越多地被医院信息系统收集和存储。医院信息中心存储的不仅是医嘱、护理记录、药物使用
等诊疗数据 ,而是所有医患角色、医疗设备、管理和服务人员在医疗系统中所产生的所有数据。在现代医
院信息化管理的“电子化、信息化、数字化、智能化”要求之下 , 医院临床数据的存储量已经可以用 TB
甚至 PB 来计量。针对医院的大数据应用一般可以分为两种 :一是用于医院管理 ,如对用药、流程等进行
挖掘和分析;二是用于临床支持,如用于临床科学研究 ,或者用于实时的辅助临床支持。医院决策系统是基
于前者的应用 ,它能够提供对医院各个单位和医疗活动各个环节的整体评价分析 ,从而为决策者进行医
护质量和医疗安全的管理和改进提供参考。医院在接诊、治疗过程中收集到的各种第一手临床诊断、治疗
数据则除了为医生临床诊断和治疗提供有用信息之外 ,还为医疗科研提供了最真实准确的样本数据。
我国是拥有超过13亿人口的大国,患者数量多,疾病谱系广,有丰富的临床研究资源,然而,与国际
同行相比,我国的临床研究能力却相形见绌,没有形成“以研促医”的体系,其根据原因并不在于,一个很主要的原因是极低,甚至停留大部分科研
人员通过EXCEL等工具少量收集临床样本数据进行研究,导致数据支撑面小,难以形成有影响力的医学科
研项目。如何从临床大数据数据分析入手,发表高质量SCI论文,是摆在众多医学科研人员面前的主要问
题。
医院临床数据往往是异构的,有关系型数据库表、XML、文本、图像等等,临床大数据搜索引擎的关
键在于解决快速搜索蕴藏在各类异构数据的关键信息,本项目将通过Hadoop的Mapreduce进行数据的分
布式读取,使用Net Lucene进行关键词匹配,可实现跨数据域、异构数据的快速搜索。同时,将以Snomed、
ICD10及专业语料库作为医学术语的支撑,让科研人员的搜索有章有循。在专业关键的搜索引擎设计上,
我们把医学专业词库,包括Snomed、ICD-10、ICD-9-CM3、医疗机构临床检验项目目录、药品字典、院内
诊断集等加入到专有词库中进行处理。同时,我们通过专业语料训练机,自动从后台分析新产生的临床数
据,根据词频的分布将语料扩展到语料库中。
处理流程如下图:
例如以下病历片段:
“患者六个月前 2013 年 9 月无明显诱因出现上腹部不适,进食后无缓解,无恶心,呕吐,无黑便等。
就诊于 XX 大学附属 XX 医院,胃镜示:胃角 溃疡,十二指肠粘膜隆起,超声内镜:胃角恶
性肿瘤,胰腺钩突占位,活检低分化腺癌。患者为求进一步诊治就诊我院,行 腹部 CT:胃癌(T3N2),胰头
多发占位,淋巴肿大可能。病理