1 / 6
文档名称:

基于CRF与规则相结合的中文电子病历 命名实体识别研究.doc

格式:doc   大小:67KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于CRF与规则相结合的中文电子病历 命名实体识别研究.doc

上传人:sssmppp 2020/9/30 文件大小:67 KB

下载得到文件列表

基于CRF与规则相结合的中文电子病历 命名实体识别研究.doc

文档介绍

文档介绍:基于CRF与规则相结合的中文电子病历命名实体识别研究翟菊叶陈春燕张铉陈玉娥刘玉文蚌埠医学院摘要:冃的:探讨基于条件随机场(conditionalrandomfield,CRF)与规则相结合的中文电子病历命名实体识别。方法:基于条件随机场和规则相结合的方法来识别实体,将语言、关键词、词典等作为特征,识别出的结果再利用规则进行优化。结果:与条件随机场的方法相比,%,%%。结论:基于条件随机场和规则相结合的方法来识别实体,准确率和召回率满足应用需求,为电子病历后续研究奠定了基础。关键词:命名实体识别;条件随机场;规则;收稿日期:2017-05-08基金:安徽省高校自然科学一般项冃(KJ2015B076by)binationofCRFandrulesZHAIJuyeCHENChunyanZHANGYuCHENYuOLIUYuwenBengbuMedicalCollege;Abstract:Objective:binationofconditionalrandomfield(CRF):binationofconditionalrandomfieldandrules-Language,keywords,dictionariesareusedasrecognitionfeatures,,%,%%.Conclusion:biningtheconditionalrandomfieldwiththeruletoidentifyentitiescanmeettheapplicationrequirements,whichwilllaythefoundationforthefollow-:\amedentityrecognition;Conditionalrandomfield;Rules;Received:2017-05-08随着我国I矢疗体制改革的深入,I矢院已经实现了I矢疗信息化。据调查,普通的市级三甲医院日门诊量达到近万人次,这就形成了海量的病历资料。电子病历是记录患者的整个临床治疗过程。患者的电子病历贯穿医疗活动的始终,是医疗信息系统的核心数据,其中包含大量潜在医疗信息,如何利用电子病历挖掘有用信息成为冃前热门的研究方向之一。电子病历是非结构化文本且缺乏统一的表述标准,要想将病历数据转化成计算机能够识别的结构化形式,首先要识别出病历文木中的实体,即命名实体的识别。电子病历中命名实体识别主要指识别出病历中如疾病名称、治疗方法、药物等实体。中文分词较英语难度大,由于没有明显的词语边界,所以已有分词方法效果不理想。冃前常用的分词方法有:基于词典的方法、基于规则的方