1 / 12
文档名称:

开放域问答技术研究进展.pdf

格式:pdf   页数:12页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

开放域问答技术研究进展.pdf

上传人:kh6797 2016/3/5 文件大小:0 KB

下载得到文件列表

开放域问答技术研究进展.pdf

相关文档

文档介绍

文档介绍:开放域问答技术研究进展张志昌 1,2,张宇 1,刘挺 1,李生 1 (,黑龙江哈尔滨 150001; ,甘肃兰州 730070 ) 摘要: ,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,,对问答技术未来的研究趋势进行了分析与展望. 关键词: 开放域问答;问题分析;相关文档检索;句段检索;答案抽取中图分类号: TP391 文献标识码: A 文章编号: 03722 2112 (2009 )052 10582 12 AdvancesinOpen2 DomainQuestionAnswering ZHANGZhi2 chang 1,2,ZHANGYu 1,LIUTing 1,LISheng 1 (11 puterScienceandTechnologySchool,,Heilongjiang150001 ,China; 21 MathematicandInformationScienceSchool,NorthwestNormalUniversity,Lanzhou,Gansu730070 ,China ) Abstract: Questionansweringisoneoftheresearchhotspotsininformationretrievalandnaturallanguageunderstanding. Thispapersummarizestheup2 to2 dateresearchadvancesinopen2 paresthedifferentapproachesin questionanalysis,documentandpassageretrieval, of2 arttechniquesarealsodiscussed,andfurtherresearchdirectionsforquestionansweringareanalyzedandprospectedatlast. Keywords: opendomainquestionanswering;questionanalysis;relevantdocumentretrieval;passageretrieval;answer extraction 1引言随着信息技术发展,人们可用的数据资源呈爆炸式增长,,在给人们带来极大方便的同时,表现出不少缺点:系统返回给用户的是排好序的一批文档链接,用户需要在其中浏览定位真正的有用信息;用户需要自己构造查询词,而构造的好坏将严重影响检索的性能. 开放域问答(QuestionAnswering,QA )研究的目标是提供更自然的信息访问交互界面,特点是:用户可以用自然语言提问的形式提出查询需求,系统从各种数据资源中自动找出准确的答案;用户的提问不限于某个特定的领域或应用[1]. 从 20世纪 60年代开始,问答技术的研究涉及了以自然语言为前端的数据库系统、限定域对话系统、阅读理解系统、基于 FAQ的问答系统等[2].随着检索技术的发展, 1999年开始,在 TREC问答评测推动下,相关研究得到了全球众多学者的重视. 2主要的研究机构与解决的问题类型对 2001年以后发表在 ACL、 SIGIR、 COLING、 NAACL、 EACL、 HLT、 LP、 EMNLP等会议上关于问答的文章按照研究机构进行统计,数量较多的一些机构如表 1. 鉴于这些会议的代表性,,复旦大学、中科院自动化所、计算所、北京大学、清华大学、哈工大、山西大学、、哈工大还多次参与 TRECQA评测,取得了不错的成绩. 受 TREC等问答评测的影响,现有研究对问答系统所回答的问题主要包含以下类型: 收稿日期:20082 042 14;修回日期:20082 082 19 资助项目:国家自然科学基金重点项目( );国家自然科学基金( );国家 863计划探索类专题项目( ) 第 5期 2009年 5月电子学报 ACTAELECTRONICASINICA