1 / 55
文档名称:

基于粗糙集的启发式属性约简特征选择方法研究.pdf

格式:pdf   页数:55页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于粗糙集的启发式属性约简特征选择方法研究.pdf

上传人:779277932 2012/2/7 文件大小:0 KB

下载得到文件列表

基于粗糙集的启发式属性约简特征选择方法研究.pdf

文档介绍

文档介绍::.
学位论文作者┟:王彳王/岱:伊【陏月弓\日郑重声明们年学位论文使用授权声明本人所呈交的学位论文是在导师指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表过或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确的方式标明。本声明的法律责任由本人承担。本人在导师指导下完成的论文及相关的职务作品,‘知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:.
摘要于粗糙集的特征选择方法在处理不一致决策表、时间复杂度等商馍系牟蛔悖随着近年来互联网技术的日趋成熟和应用范围的不断扩大,以文本形式存在的网络资源开始与同俱增。面对海量的信息,人们出现了“信息迷失的现象”,将海量信息根据内容进行归类成为了必然的选择。.自从年美国的瓻首次展开对自动分类的研究以来,文本分类正在赢得越来越多研究人员的关注,关于文本分类的研究成果层出不穷,并已经被成功地应用于搜索引擎、信息过滤、数字图书馆、邮件分类等领域。作为文本分类的重要环节,特征选择对文本分类起着至关重要的作用。因此,如何利用高效的特征选择方法降低文本特征集维度,已经成为文本分类研究领域中一个重要的研究课题。本文在经典粗糙集理论的基础上,首先分析了粗糙集理论在特征降维方面的优势,给出了运用粗糙集理论进行特征选择的可行性分析。然后针对目前基本文提出了基于粗糙集的启发式属性约简特征选择算法,并将其应用到特征选择中,不仅大大提高了文本分类的效率,同时也为特征选择研究增添了新的研究内容。最后在研究了改进的特征选择算法的基础上,通过与传统特征选取方法实验对比,表明该算法在不一致决策表中能较好地进行特征降维,获得较好的分类结果。结合粗糙集理论,本文讨论了文本分类特征选择中存在的问题,并对启发式属性约简特征选择进行了深入地研究,本文主要工作如下:致哿搜√獾难芯恳庖澹隽舜植诩砺鄣幕靖拍睿芯苛擞跋煳本分类的重要因素,分析了常见的文本分类特征选择方法的特点,详细介绍了当前基于粗糙集的特征选择方法;A搜扒蟾8咝У奶卣餮≡穹椒ń刑卣鹘滴疚脑诟攀隽嘶诖糙集的文本分类基础上,尝试把粗糙集中的启发式属性约简算法引入特征选择
中。在一致决策表中,本文在传统基于粗糙集的正域约简特征选择方法基础上,提出了启发式正域约简特征选择方法,用于特征降维;针对决策表不一致现象,本文引入粒度函数来度量不同属性集之问的差异,并给出了基于粒度函数的启发式属性约简特征选择算法,为文本分类特征选择提供了新的研究方向;ü允笛橛锪辖惺笛椋疚难橹ち松删霾叻掷喙嬖虻挠行浴J验发现,该算法不仅能较好地降低文本特征项集的维数,还能较好地改善分类的效率。实验结果表明将基于粗糙集的启发式属性约简方法应用到特征选择中是切实可行的。最后,本文对基于粗糙集的文本分类特征选择研究进行了总结,并对研究中某些尚待完善的地方,提出几点设想以供下一步研究。关键词:文本分类,特征选择,粗糙集,决策表,启发式属性约简摘要
.’..,·.甒琲琾‘眎,,瑃琻甀琲疭瓻’..
瑀,.琣甌琣,,.:琩瑂,甀;琣’,
目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.引。言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..国内外相关研究概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究目的与意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.主要工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第二章基于粗糙集的文本分类概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯粗糙集理论基本概念⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.⑾⒏河颉⒈⒋植诙取信息系统与决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..畔⑾⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯知识约简⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.基于粗糙集理论的文本分类过程简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯分类过程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⒒目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯