文档介绍:基于差分演化算法的粗糙集离散化及属性约简的研究长沙理工大学硕士学位论文学校代号:学号:密级:公开学位申请人姓名导师姓名及职称培养单位专业名称论文提交日期论文答辩日期高意颜宏文教授长沙理工大学计算机应用技术年
㈣Ⅲ
≯≮
作者签名:南童。蓖苏宏丈学位论文原创性声明长沙理工大学学位论文版权使用授权书日期:年滦奕本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。日期:年,月日本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。本学位论文属于⒈C芸冢年解密后适用本授权书。⒉槐C芡拧朐谝陨舷嘤Ψ娇蚰诖颉啊阥月救作者签名:导师签名:日期:≥口
,提出了一种启发式离散化方法一一当前,数据挖掘已广泛应用于金融、制造和医疗等领域。但随着知识库的信息量急剧增加,人类迫切需要一类工具能从数据量大、冗余多,且存在噪声数据干扰的知识库中提取潜在有价值的规则。由于粗糙集在这些方面具有优良性能,其已越来越多地应用于数据挖掘。实际应用的知识库存在大量连续数据,而以等价关系为核心的粗糙集只能处理离散数据。因此,在利用粗糙集方法缡粜栽技处理连续数据之前必须将其离散化。本文分析比较了各无监督离散化方法和有监督离散化方法的优缺点,基于差分演化算法的离散化算法。该算法采用实数串表示个体,增强了对局部最优点的搜索能力,并在此基础上给出了二值个体和一种适应值函数的定义形式,其中二值个体的定义形式上因条件属性而异设置不同的阈值,适应值函数考虑到了粗糙集理论的特殊性。最后通过数据集的测试实验,验证了该算法是有效知识库的各属性的重要性并不是等同的,在确保不改变知识库的分类能力的前提下,可以删除其中冗余的或者重要性较低的属性。本文探讨了属性约简的启发式算法,,并提出了一种基于差分演化算法的属性约简算法,分别讨论了其在相容决策表和不相容决策表中的约简情况,进而引出了一种新的适应值函数定义形式和一种新的差分操作使变异向最小属性约简相应的个体进化。最后通过两组实验证明该算法是有效的,它的计算复杂度与基于遗传算法的属性约简的计算复杂度相当,但它的收敛速度是基于遗传算法的丁关键词:粗糙集;差分演化算法:离散化;属性约简的。
珼琺,,.琲.,.,.甌··,.瑃甕甆瓸