文档介绍:摘要随着互联网络的高速发展,问答系统的研究成为当前自然语言处理领域中最有活力的方向之一。同时基于常问问题集的问答系统的应用也越来越广泛。它综合运用了知识表示、信息检索等技术,广泛应用于网络答疑、公司客服等方面。在众多的问答技术中相似度计算是中文信息处理中最为基础和重要的工作,它直接决定着某些领域的研究和发展状况,例如,自动问答系统、机器翻译、信息检索、自动文摘等领域。长期以来一直是人们研究的一个热点和难点。传统的中文常问问答系统中,相似度的计算大多采用基于关键词匹配的方法或者统计的方法,效果不尽人意。相似度计算成为影响系统性能的最主要因素。本文选择知网系统作为相似度计算的基础,深入研究了知网系统的语义结构,实现了基于知网的语义相似度计算模块。并以此为基础实现了一个实际的常问问答系统。自然语言中一词多义现象普遍存在,成为制约相似度算法精度和速度的一个重要因素,同时也影响了常问问答系统的性能。本文针对这一现象,引入了词义消歧的思想。实现了基于知网的词义消歧,并对知网系统的义项文件进行了整理,改进了基于知网的词义消歧方法,提高了消歧算法的精度和速度。并将该词义消歧方法与基于知网的相似度计算方法结合起来,实现了真正意义上的语义理解。以此为基础,实现了一个实际的本文中消歧模块和语义相似度模块的测试语料均为作者精心搜集整理,常问问答系统的测试问答集合是由东北财经大学网络教育学院提供的真实的问答集合。测试结果表明,引入消歧思想后,相似度的计算精度得到了提高,常问问答系统的总体性能也达到了实际应用的需要。因此,可以说发展中文问答技术的一个重要途径就是消歧算法的改关键词:问题回答;常问问答系统;语义相似度;词义消歧;知网大连理工大学硕士学位论文常问问答系统。进。
知识水坝***@pologoogle为您整理
—.。躠基于语义理解的中文常闯问答系统的研究..’.琤..畉.——
知识水坝***@pologoogle为您整理
篞;大连理工大学硕士学位论文;.:.籉
喇..作者签名:玄:李独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。日期:
丛年监月霉日新躲缓绯麴:墅大连理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论作者签名:大连理工大学硕士研究生学位论文文。
髀课题的研究意义随着互联网的高速发展,越来越多的信息呈现在网络上,通常网民们通过网络搜索引擎来获得自己想要的信息。著名的搜索引擎蠫、百度等等。这些搜索引擎的发展已取得了很大的成功,但是这些传统的搜索引擎也存在着很多的不足。首先,这些搜索引擎都是要求用户输入关键词或关键词的组合。实际上,用户要检索的内容往往都是很复杂的,无法用关键词或者关键词的组合表达清楚,搜索引擎的分析理解也就不可能接近用户的检索要求;其次,传统搜索引擎返回的是大量网页的列表,用户需要阅读这些网页,查找自己需要的信息。而这些网页中存在大量冗余的、用户不感兴趣的信息,影响了搜索的准确度和速度;此外,用户更习惯于用自然语言来描述一个问题即使用一个句子进行描述。使用关键词作为匹配的基准,仅仅停留在词语的表面信息上,没有考虑词语在句子中的具体语义,检索的精度很难得到更进一步的提腔谡庑┎蛔愣⒄蛊鹄吹摹问答系统是指能够对计算机用户输入的使用自然语言句做出回答的计算机程序【俊N蚀鹣低臣匀挥镅源、信、知识表示R惶澹找娉晌国际上研究的热点。它既能够让用户用自然语言提问,又能够为用户返回一个简洁、准确的答案,而不是一些相关的网页。因此,自动问答系统和传统的依靠关键字匹配的搜索引擎相比,能够更好的满足用户的检索需求,更准确的找出用户所需要的答案,具有简称,基于百科知识的问答系统以及开放域的问答系统。基于常问问题回答系统可以作为后两种问答系统的一个组成部分。在问答系统中,对于用户输入的问题,首先在常问问题集合中查找答案,如果找到相应的答案,就可以直接返回给用户,提高了效率。此外,在现代社会激烈的竞争中,各大公司、企业越来越注重产品设备的咨询服务和售后服务;各个大学也相继开设了网络教育课程,学生们希望通过网络了解报名、考试、结业等相关信息。由此可以看出,很多情况下用户只对一个领域