文档介绍:基于粗糙集的属性约简算法研究摘要需要任何先验知识,或任何附加信息,就能有效地分析和处理不精确、不完整粗糙集理论是由波兰数学家甈晏岢龅模羌谈怕事邸⒛:数学、证据理论之后又一种处理不确定性的有效数学工具。该理论的特点是不和不一致的信息。并从中发现隐含的知识,揭示潜在的规律。数据挖掘和知识发现是从现存的数据库、数据仓库或其它信息库中挖掘有价值的知识的过程。粗糙集理论是一种新的数据挖掘技术。属性约简是利用粗糙集理论作为工具来进行数据挖掘的关键技术之一。本文对粗糙集理论进行了研究,提出了一种基于区分矩阵和属性重要性的改进算法。针对决策表中存在的不相容问题,本文在对前人算法讨论的基础上,提出一种基于痠燃劾嗷值脑技蛩惴āW詈螅疚脑谧芙崃松鲜龈鞲鏊惴ǖ特点后,提出一种基于树的约简算法,该算法的特点是能够得到决策表的所有约简,并且适合相容决策表和不相容决策表。关键词:数据挖掘,粗糙集,属性约简,区分矩阵,树内蒙古大学硕十学位论文
趖痠,篋,嚣薹,猘琻·瓺,甊.。,,基丁租糙集的属性约简算法研究琁
图表目录表汽车数据库⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图约简树第一层⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图最后约简树⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图数据挖掘和其它学科的关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。图数据挖掘的基本过程和主要步骤⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图粗糙近似⋯⋯■⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表某一知识表达系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表表对应的区分矩阵⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表表对应的区分矩阵⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。⋯⋯⋯⋯⋯⋯..表籇怠表区分矩阵表区分矩阵浮表决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。值⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表表的转换决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表表的转换决策表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表表的区分矩阵⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.内蒙古大学硕宦畚
鉴銎玄鏖务一五原创性声明在学期间研究成果使用说明书本人声明:所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。蒙古大学研究生在校攻读学位期问论文工作的知识产权单位属内蒙古大学。学校一墟己经发表或撰写过的研究成果,也不包含为获得内蒙古大学或其他教育机构的学学位论文作者完全了解内蒙古大学有关保留和使用学位论文的规定,即:内有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公靠学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期認导师的同意:若用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公丌发表。学位论文作者签名:日期:●骭尹
第一章绪论数据挖掘当今,随着计算机网络和通讯的发展,产生了大量的数据,并且,伴随着计算机硬件的飞速、稳定的进步,对这些数据的存储也成为了可能。庞大的数据集带来了海量的信息,但是如何从这些浩如烟海的数据和信息中获得自己感兴趣的有用的信息已经远远超出人的处理和理解能力。结果大量数据被收集在大型数据库中常年得不到访问,成为“数据坟墓!】数据挖掘,英文为图创建一个数据库中描述的复杂世界的简单模型,因而我们也可以说数据挖掘是处理大量信近的另一些术语有数据库中的知识发现数据挖掘是广义的交叉学科,对数据挖掘技术的研究涉及数据库、人工智能、统计学、可视化、并行计算等多门学科,也吸引了大批各领域学者和工程技术人员的关注。下面的五个步骤来说明数据挖掘的过程:清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。,对于它的描述有许多不同的说法,其中最普遍的定义为:数据挖掘是指从大量数据中抽取隐含的、不为人知的、有用的信息。数据挖掘也被描述为试息的方法,并且它有助于以比任何人都快的速度发现有用的信息。与数