文档介绍:东北师范大学
硕士学位论文
用户驱动的特定领域自动文摘系统设计与实现
姓名:石子言
申请学位级别:硕士
专业:计算机软件与理论
指导教师:张琢
20090501
摘要随着现代科技的高速发展,报纸、书籍、科技文献等以文字为载体的信息大量涌现。尤其是在国际互联网络高速发展的带动下,每天都会有不断涌现的海量信息。为了能从这些海量的信息中快速、准确的找到用户需要的信息,文章的自动文摘成为越来越被关注的研究课题。在研究比较了相关的自动文摘方法后,我们采用基于统计的自动文摘方法实现了一个用户驱动的自动文摘原型系统,对其性能进行了测试。指代是现实生活中比较常见的语法现象,在文章处理过程中也常常因指代问题导致文摘生成结果不准确。针对自动文摘因指代问题产生的问题,本文结合目前的研究状态,对篇章消解算法进行了简介,并提出一种类似于篇章消解算法思想的特定领域的自动文摘系统的实现方法。通过分析原始文本中存在的指代关系,重新计算词频和句子的重要度,来获得新的文摘结果。本文详述了用户驱动的特定领域自动文摘系统实现方法,并通过实验验证了类似篇章消解算法的应用对于文摘结果的改善。为了验证所提出方法的可行性和有效性,本文采用内部评价方法对开发的文摘系统进行评估。从论文库中抽取政治学科的B畚模袢∥恼#衅测,可以看出我们提出的类似于篇章消解算法的方法对特定领域自动文摘系统的关键词:篇章消解算法、自动文摘、特定领域、用户驱动性能有所改善。
瑆瓸,,...’,甌甤瑃。.,篟、.
学位论文作者签名:乒奠鑫淦冢毫⒁钛挂学位论文作者签名:琏电话:——邮编:——指导教师签名:忌期:之坚皇担独创性声明学位论文使用授权书苗本入郑重声明:所提交的学位论文是本人在导师指导下独立进霉予研究工作所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过昀研究成果。对本人的研究徽出重要贡献的个人和集体,均已在文中作了明确的说明。本声明的法律结果由本人承担。本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编本学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ甥:工作单位:通讯地址:磊学位论文作者毕业后去向:酲
言课题研究背景及意义东北师范大学硕士学位论文科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。许多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究】。为了减小文档的存储空间和提高用户的信息搜集效率,自动文摘技术应运而生。将信息全面的、简洁的文档直接呈现给用户,提高用户获取信息的自动文摘就是利用计算机对文献编制的文摘。摘要是以提供信息内容梗概着信息数量的飞速增长和计算机技术及网络技术的迅速普及,人们对于自动摘录统的手工编制方法对于摘要员的基础素质要求较高,而且编织效率低、时差大、编制出的摘要易出现主观性和片面性。因此,利用计算机等技术对各类信息进行摘要编制已经成为必然的趋势。当然,人们希望自动文摘的结果能够满足人们的需要。国际上对自动文摘的研究可以说是与自然语言处理其他领域的研究同时起步的。由于计算机硬件限制和自动文摘研究缺乏基础性技术,所以,;从年代末期开始,自动文摘技术才进人蓬勃发展、百家争鸣的时代。不同领域的人员对资源的需求是不同的,为了满足某一领域用户的需求和提高自动文摘系统的性能,特定领域的自动文摘系统的建立得到了研究人员的重视。针对特定领域的术语、知识、文章特点等所建立的特定领域的自动文摘系统将更具有专业性,而且,效率、质量也会大大提高。随着计算机、网络和多媒体等技术的迅速发展,信息技术已被应用到了各行各业,为它们的发展提供了技术支撑。教育领域也不例外,当前,教育信息化工作得到了进一步的普及。一些教育机构和软件公司投入了大量的人力和财力来开发教育软件和教学资源库。再先进的软件,如果没有高质量的教学资源库的支持,它的价值很难得以体现。可见,教学资源库的建设工作变得越来越重要。随息没有查到几篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功效率俊为目的,不加评论和补充解释、简明、确切地记述信息重要内容的短文俊K系统的需求也越来越迫切。如何编写出一篇准确、简要的高质量摘要是一个尚未很好解决的问题。传
国内外研究现状东北师范大学硕士学位论文着资源的迅速增多,大大增加了使用者的检索和浏览