1 / 60
文档名称:

面向历史科目的问答技术研究.pdf

格式:pdf   大小:1,256KB   页数:60页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向历史科目的问答技术研究.pdf

上传人:陈潇睡不醒 2021/10/18 文件大小:1.23 MB

下载得到文件列表

面向历史科目的问答技术研究.pdf

相关文档

文档介绍

文档介绍:硕士学位论文
面向历史科目的问答技术研究
RESEARCH ON QUESTION ANSWERING
TECHNOLOGY FOR ANSWERING
HISTORY SUBJECT QUESTION
俞可
哈尔滨工业大学
2017 年 6 月
国内图书分类号: 学校代码:10213
国际图书分类号: 密级:公开
工学硕士学位论文
面向历史科目的问答技术研究
硕 士 研 究 生:俞可
导 师:郑德权副教授
申 请 学 位:工学硕士
学 科:计算机科学与技术
所 在 单 位:计算机科学与技术学院
答 辩 日 期:2017 年 6 月
授予学位单位:哈尔滨工业大学
Classified Index:
:
Dissertation for the Master’s Degree in Engineering
RESEARCH ON QUESTION ANSWERING
TECHNOLOGY FOR ANSWERING
HISTORY SUBJECT QUESTION
Candidate: Yu Ke
Supervisor: Associate Prof. Zheng Dequan
Academic Degree Applied for: Master of Engineering
Specialty: Computer Science and Technology
Affiliation: School of Computer Science and Technology
Date of Defence: June, 2017
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
摘 要
近年来,人工智能在许多方面取得了突破性的成就,因此越来越受到人们的关
注。自动问答系统就是人工智能中的一个很重要的分支,也是自然语言处理领域
中的一个值得长期研究的目标。现有的问答系统通常可以分为基于检索的问答系
统和基于知识库的问答系统,这两种系统在回答问题时都需要事先储备一些相关
的背景知识,只不过知识库中存储的都是结构化的易于理解的数据,而基于检索的
问答系统通常包含大量的互联网文本,因此在回答问题时都会通过相关的查询产
生若干的候选答案,接下来就需要计算每个候选答案与问题的相关程度,从而去除
不相关的候选答案,最后得到问题的最佳答案。
本文主要研究了面向历史科目的相关问答技术,包括问题分类、问题成分抽
取、以及对问题候选答案的置信度排序问题。在得到一个问题之后,首先需要对问
题进行分析以构造相关的查询,然后经过查询得到若干的候选段落,最后对候选段
落中的句子进行置信度排序从而得到简短、准确的问题答案。本文尝试将深度学****br/>的方法应用到问题分类、问题成分抽取和答案置信度排序中,具体研究内容如下:
1. 本文建立了针对历史科目的问题分类语料集和问题成分抽取语料集,将历
史材料题进行分类并识别出问题中的关键要素。另外,本文建立了用于历史科目
答案置信度排序的数据集。
2. 构建了基于深度学****的问题分类模型,并且使用了传统方法 SVM 与其进行
对比。实验结果表明,深度学****法明显优于传统的方法,其中 CNN 模型取得了最
佳的效果,达到了 % 的 Micro-F1