文档介绍:上海交通大学
硕士学位论文
基于本体的中文智能答疑系统研究与实现
姓名:宗裕朋
申请学位级别:硕士
专业:软件工程
指导教师:吴刚;姜丽红
20071201
上海交通大学硕士学位论文摘要
基于本体的中文智能答疑系统研究与实现
摘要
随着互联网的普及,网上信息越来越丰富。但是,传统搜索引擎有
许多不足之处,它返回的是许多相关的网页,而不是准确的答案。另外,
它仅以关键词索引,没有触及到语义信息,因此很难真正理解用户的意
图。而在问答(Question Answering,QA)系统中,用户可以使用自然语言
进行提问,系统通过对问题分析和理解,直接返回给用户答案。因此问
答系统更好地满足了用户的要求。可以说,QA 系统是新一代的搜索引擎。
近年来,本体(Ontology)受到人工智能领域的普遍关注,并得到了广
泛应用。在受限领域 QA 中采用本体知识库,可以更好的表示知识之间
的内在关系,知识的组织更加合理,减少冗余存储,也有利于进行基于
语义的答案抽取。
本文在分析当前智能答疑系统的前提下,将本体技术引入智能答疑
系统(Intelligent Question Answering System,IQAS),构建出一个针对银行
个人业务的领域本体,将该本体作为语义理解的信息基础,这样就将在
一定程度上改善现有 QA 中语义理解不足的问题。
本文的系统设计模型主要有两个核心模块和两个核心资源,核心模
块分别为语法分析模块(Linguistic Analysis,LA)和语义相似度服务模
块(Semantic Similarity Service,SSS)。首先 LA 将用户的问题经过分词、
词性标注和问题模式匹配后得到查询语法块(Query Linguistic Block,
QLB),并找出对应的问题模式,然后 SSS 再基于领域本体库和《知网》
第 I 页
上海交通大学硕士学位论文摘要
()将查询语法块(QLB)映射成与领域本体库相关的本体语义块
(Ontology Semantic Block,OSB)。核心资源分别为领域本体库和问题模
式库。本文首先根据银行业务领域答疑系统的特点,构建出一个小型领
域本体库。然后通过对常见问题的语法分析,建立了问题模式库。
对于 QLB 无法直接映射到 OSB 的情况,IQAS 将计算原问题与一组
候选问题的语义相似度,如果计算出的语义相似度高于阈值,则认为这
两个问题是相似的,从而将候选问题的答案作为原问题的“替补”答案。
针对语义相似度的计算,本文提出了一种基于上下文的计算本体内概念
间语义相似度的算法,从概念的父代和子代两个角度进行计算。该算法
充分考虑了概念所处的具体环境,充分利用了本体中概念的语义信息。
通过本文的研究表明,基于本体的智能答疑系统可以有效地利用领
域本体的信息资源,在一定程度上解决了目前答疑系统对语义理解不足
的问题,并且能够具有较高的准确率。
关键词:本体,答疑系统,语义相似度,问题模式
第 II 页
上海交通大学硕士学位论文 ABSTRACT
Research and Implementation of
Chinese Intelligent Answering System Based on Ontology
Abstract
With the development of , net resources became increasingly rich.
However, traditional search engine exist many disadvantages. For example, it
returned the web pages not the exact answers. Furthermore, it was too difficult
to understand the purpose because traditional search engine which based on
the keyword index did not deal with the semantic information. But the user
could ask the nature language questions in the Question Answering System
which returned the answers directly after analyzing and processing the