文档介绍:河南大学
硕士学位论文
常识知识问答系统中知识库构建的研究与设计
姓名:汤赛丽
申请学位级别:硕士
专业:应用数学
指导教师:郑逢斌
20050501
摘要河南大学硕士研究生学位论文知识库作为问答系统中用来储存知识的仓库,在整个系统中起到了非常重要的作用。一个功能和知识完备的知识库能够大大提高问答系统的效率与准确率。因此本文主要讨论问答系统的知识库构建的思想方法。本文知识库的设计主要针对常识知识问答系统,由于常识知识的领域范围较广,知识的稳定性较差,因此知识的搜集和分类整理以及长期的维护将是知识库消耗大量的人力物力,以及基于传统信息检索与信息提取的问答系统答案准确性不高的缺点:同时充分发挥前者问答准确,可以进行一定的推理计算的优点,,构建高效的知识库。本文主要从以下几谖侍獾拿嫦蚨韵笾J侗硎痉椒ㄊ潜疚墓菇ㄖJ犊獾闹饕7椒ǎ以面向对象表示法为主体,每个对象以一个单独的文本来描述。将用户针对该对象经常提出的问题的类型名作为类或对象的属性名,能够回答该问题的文本内容作为属性的值。本文将用户问题分为十类,每一类对应一个属性名称,该属性名芯坷谩凹虻ハ蛄烤嗬敕ā倍匀肟獾奈谋窘凶远掷唷芯坷锰卣鞔实渫ü跃渥咏刑卣魈崛〉姆椒ǘ栽嘉谋窘凶远本文对于知识的搜集分类以及文本的标注均采用机器自动为主,人工干预为帽疚墓菇ǖ闹J犊飧咝ё既返鼗袢〈鸢傅姆椒ā关键词:问答系统,知识表示,面向对象,知识库,特征提取,相似度第的一项重要任务。为了克服传统的基于知识库的问答系统需要建立大规模知识库,个方面进行了研究:·称作为标记将标注到描述对象的文本中。利用基于问题的面向对象的知识表示方法,可以避免人工将知识形式化为知识点的繁杂过程。辅的策略,在减少入力的同时大大提高了准确率。汜。
河南大学硕士研究生学位论文≯...瑆..甀..甌甌
河南大学硕士研究生学位论文第簈,—,,,瑂.
第滦髀自然语言理解与问答系统论文的目的和意义河南大学硕士研究生学位论文第,有时也称为计算语言学,它是研究如何利用计算来理解和生成自然语言的。一般把人工设计的像就是人们日常使用的语言⋯。自然语言和各种符号语言一样,是人们进行推理和交流的桥梁,由于语言在智能活动中具有重要的作用,当计算机在不同领域逐步替代人类完成各项工作时,人们也期待着计算机在自然语言的处理上能够接近甚至达到人的智能水平。因此,自然语言理解着力于研究如何让计算机理解自然语言,而且已成为人工智能研究中最活跃的领域之一。在过去二十几年里自然语言理解领域发展了许多新技术、新概念,许多国家都投入巨大的人力、物力、财力研究用于自然语言‘同计算机进行通讯的课题,其中包括问答系统的研究与开发。问答行为在人们的闩常生活中是非常常见的,也是重要的,因此问话的理解,行为非常的少,因此对于句式灵活多样的口语,这种形式的“理解”显得“呆板”、“木纳”,使得许多问话都无法分析识别,直接导致了系统的准确性降低。,增加人们维护的工作量,代价是巨大的。随着自然语言理解研究的深入,更多的采用际醯奈蚀鹣低辰ɑ徂鹌0迤ヅ湔种笨拙的方法,采用统计的方法并且结合自然语言的规则将会使得问答系统对自然语言的理解更加准确、灵活。对于基于知识库的问答系统来说,知识库的构建是相当重要的部分。由于知识的更新较为频繁,因此知识库的构建必须具有易于维护、组织和管理的特点。早先的知识库,通常使用关系数掘库来组织,同时利用库中二维表来表示知识。这样做有两点不足:第一,知识在入库的时候需要经过处理,变成记录的形式以自然语言理解镅浴语言、镅浴ⅰ鹊扔镅猿莆H斯び镅裕匀挥镅答话的自动生成也就成为自然语言’理解研究的重要课题之一。早期的问答系统,未充分采用自然语言理解的技术,问话的理解仅仅采用简单的模式匹配,理解的
河南大学硕士研究生学位论文加人力资源的代价。第二。需要对关系数据库中的记录经常地进行维护,比如添第适应二维表的存放,因此以文本或其它多媒体形式疚闹饕L致畚谋拘问降闹识,其它形式的知识这罩不作讨论嬖诘闹J缎枰H斯ざ云浣行问交徒峁的低。这样,如果不进行人工干预,知识库的质量是相当低的,这势必会影响到系统其它模块的性能。以至最终的结果。但是,如果人工对库进行修正,又会增加、修改、删除等操作是数据库维护中必须的。由于该知识库的维护操作非常频繁,因此所需的代价无论是人力、物力还是时间都是非常大的。这个代价在接个系统的丌发过程中是相当可观,不可忽视的,而且知识库在整个问答系统中也是起着重要的作用。众所周知,数掘库的维护是必要的。所需要的操作例如添加、修改、删除也都必不可少,那么要减小这个代价就要从减小这些操