文档介绍:硕士学位论文
交互式问答中的问句多样化和用户个性化
研究
QUESTION DIVERSITY AND USER
PERSONALIZATION IN
INTERACTIVE QUESTION
ANSWERING
李白
哈尔滨工业大学
2011 年 12 月
国内图书分类号:TP 学校代码:10213
国际图书分类号: 密级:公开
工学硕士学位论文
交互式问答中的问句多样化和用户个性化
研究
硕士研究生: 李白
导师: 王晓龙教授
申请学位: 工学硕士
学科: 计算机科学与技术
所在单位: 深圳研究生院
答辩日期: 2011 年 12 月
授予学位单位: 哈尔滨工业大学
Classified Index: TP
:
Thesis for the Master Degree of Engineering
QUESTION DIVERSITY AND USER
PERSONALIZATION IN
INTERACTIVE QUESTION
ANSWERING
Candidate: Bai Li
Supervisor: Prof. Xiaolong Wang
Academic Degree Applied for: Master of Engineering
Specialty: Computer Science and Technology
Affiliation: Shenzhen Graduate School
Date of Defence: Dec, 2011
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
摘要
随着 时代的到来,个人用户已经越来越多的参与到互联网信息的产
生当中,各种各样的博客,微博,论坛和社区,每天都产生了大量的信息和数据。
随着海量信息的不断整张,基于关键词查询的传统搜索引擎越来越难以满足网络
用户快速准确地查询信息的需求。近年来各种各样的在线社区问答系统的大量出
现,例如百度知道,新浪爱问和搜搜问问等等。在线问答社区已经成为用户上网
获取知识的重要手段之一。
大量的在线问答社区以及用户每天都产生了海量的问题和答案对,这种问答
对资源是经过人工筛选的,答案的准确性和质量都是非常可靠的。于是,以在线
问答社区的问答对资源建立的自动问答系统和自动问答的研究也越来越热门。社
区问答系统和以社区问答系统的问答对为资源的自动问答系统也有自身的不足,
它们往往都是单句式的问答,与用户个人信息无关的问答。如果能在问答系统中
加入连续问答的模式以及用户的个人习惯的信息,则能在一定程度上提高对用户
问题回答的针对性和准确性。
本文针对目前的自动问答系统在返回答案多样性和用户个性化方面的不足,
使用问句的分类信息和用户的交互式行为,提出了一种图形化的交互形式,改进
了问答系统的返回答案的排序方式。主要工作如下:(1)在原型问答系统上加入
了处理三层问句分类信息的问句检索算法。(2)针对问答系统返回答案单一化的
缺陷,设计实现了返回答案的多样性算法。(3)加入了图形辅助的交互式问答用
户界面,通过收集交互式问答语料,建立了用户个性化模型,并用于改进问答系
统。
关键词:交互式问答;问句多样化;用户个性化;增强型学习
-I-
哈尔滨工业大学工学硕士学位论文
Abstract
With era, more and more individuals have been involved in the
production of information among a variety of blog, micro blogging, forums and
community. Every day, generated a lot of information and data. Traditional
search engines serve as the guidelines to provide people the information. But only
with the traditional search engine is far fr