文档介绍:本人签名:聱趋:日期塑里仝ǎ篫日期疩拿:.三:褐鳎篫西安电子科技大学学位论文独创性虼葱滦声明西安电子科技大学关于论文使用授权的说明’日期丝秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他入已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学。C艿穆畚脑诮饷芎笞袷卮斯娑本学位论文属于保密,在年解密后适用本授权书。本人签名:导师签名:...
摘要随着计算机技术和因特网的快速发展,试匆丫晌H嗣腔袢≈J队胄息的重要来源。毯舜罅康奈谋拘畔ⅲ绾谓玏资源的文本数据提取出来,组织成有确定模式结构的、有明确语义信息的、支持高级数据应用的有用的信息,将其载入到谋臼莶挚庵腥ィ晌C嫦騑文本的数据清洗技术研究的重点。本论文的研究内容是面向谋镜氖萸逑醇际醯难芯坑胂低车氖迪帧M过开发谋臼萸逑聪低常氐阊芯亢吞致哿怂婕暗腤文本清洗的关键技术。介绍了基于主题方法的谋臼莶挚夤菇ḿ际酰⑹褂酶眉际跎杓屏谋臼莶挚狻8軭慕峁固氐悖岢鼋溆成湮J餍徒峁梗ü的解析获取谋镜闹饕D谌荨?悸堑街形氖莸奶氐悖捎昧嘶谧典的统计分词算法实现文本分词;利用分词的结果采用基于词共现模型的方法实现关键词的提取;使用基于统计的摘要算法,采用直接从原文中选取子句生成摘要的方法实现自动摘要的提取。提出了一种基于亩嗬喾掷喾椒ǎ荻喔分类器对测试文本分类。采用基于向量空间模型的方法实现了相似文本清洗功能。针对以上研究成果,本文描述了谋臼萸逑聪低车纳杓坪褪迪窒附凇关键词:谋臼莶挚馐萸逑信息提取文本分类相似文本
,瓵甌琖甒瓵“—”,.,—..琩,
目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯课题背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯研究内容与组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。:⋯⋯⋯⋯.第二章谋臼莶挚狻骸数据仓库⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第三章趁娴姆治鲇氪怼趁娴拇嬖诜绞健璤⋯⋯⋯的格式⋯⋯“⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯的特点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯甧趁娴拇怼的树型结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯树结构解析⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第四章谋拘畔⒊槿信息抽取技术综述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.畔⒊槿〉⒊槿〉娜挝瘛文本分词的实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.?椤关键词提取的实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..丶侍崛〖∧?椤..
自动摘要的实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...远R<?椤本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯?榈纳杓朴胧迪帧本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第六章面向谋镜氖萸逑聪低成杓朴胧迪帧系统体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯系统功能模块组成⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.谋臼莩槿∧?;荒?椤#?椤系统详细设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第七章总结与展望⋯