文档介绍:摘要关键词:粗糙集,变精度容差关系,分辨矩阵,数据挖掘粗糙集理论是由教授于世纪年代初提出的一种用于处理不确定性和模糊知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它适合于发现数据中隐含的、潜在的、有用的规律,即知识,找出其内部数据的关联关系和特征,而无需提供相关数据集合外的任何先验信息,使问题处理更客观、更符合实际。近年来,粗糙集理论和应用取得了很大的成功,已成为软计算方法的重要分支,其涉及的领域包括模式识别、机器学习、决策分析和决策支持、知识获取、知识发现等。但对不完备决策信息系统问题的处理还不甚完善,论文对此进行了专门的研究,提出了一些解决方法。首先介绍了粗糙集的基本理论及其在不完备不协调信息系统下的扩展模型,在指出它们的局限性后,提出了一种基于变精度容差关系的扩展粗糙集模型,该模型将一定的统计信息和人的心理因素结合起来以划分分辨类,并进一步定义了上、下近似集和属性的重要性。然后考虑了求约简的问题,,目前出现了很多启发式算法,但利用分辨矩阵是主流。论文提出了一种新的分辨矩阵的求法,克服了基于容差关系得到的分辨矩阵核属性过多和其它非空元素包含分辨属性过少的缺陷。在此基础上,又给出了一种新的求约简集的算法,此算法计算复杂度比已有的基于分辨矩阵求约简的计算复杂度明显降低。得到约简集后,接下来进行了规则提取工作,建立了知识树,研究了知识树的剪枝条件,给出了规则提取算法,不仅降低了计算复杂度,而且还减少了冗余规则。并且论文每一个模型或算法都用进行了程序实现,其后还给出了算例分析,以此验证这些模型及算法的有效性。论文的最后对基于变精度容差关系扩展粗糙集在保险公司客户流失及汽车里程决定因素分析中的实际应用进行了探讨。
瓵甋畁瑆甀,琣,瑃,甌,琣甋琣瑀,琺,.瓼.....瓵—痵甀
篟,琕,
日期望趔月作者签名:鬃&互蔓硷一日期:竺闘月五日原创性声明关于学位论文使用授权说明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在在论文中作了明确的说明。本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根据国家或湖南省有关部门规定送交学位论文。
第滦髀研究背景信息产业是现代社会的三大支柱产业之一,信息是现代社会的基础,而数据库技术则又是信息处理技术的基石。然而一方面随着人类活动范围的扩展、生活节奏的加快,以及科学技术的进步,人们能以更快和更廉价的方式获取和存储数据,使得数据和信息的数量以指数级增长,形成了“数据爆炸但知识贫乏’’的现象;另一方面自然科学、社会科学和工程技术的很多领域中,都不同程度地涉及到对不确定因素和不完备畔⒌拇恚掖邮导氏低持胁杉降数据往往还包含着噪声;同时,人们需要的,也不仅仅是查询和检索,他们需要规则,根据现有的数据预测未来的发展趋势,以此来帮助他们决策。因此迫切需要新的知识发现工具对数据进行分析、推理,发现数据间的联系、提取有用特征、简化信息处理、减少信息的浪费。那么自然对不精确、不确定知识的表达、学习、归纳等方法的研究就成为智能信息处理中的重要研究课题,而粗糙集就是其中非对以上问题的处理方法,目前主要有模糊集、,且已应用于一些实际领域。然而模糊集、基于概率统计方法的证派函数和有关统计概率分布等,可这些信息有时并不容易得到。而粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系,由等价关系构成对该空间的划分。并且粗糙集理论将知识理解为对数据的划分,每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库,将不精确或相关。粗糙集理论是数据挖掘领域中又一个有效的方法与数学工具。第一,数据挖掘研究的对象多为关系型数据库,而关系型数据库的关系表可以被看作是粗糙集理论中的决策表;第二,现实世界中的规则有确定性也有不确定性的,数据库中也同样包含确定的显性规则和不确定的潜在规则。从数据库中发现不确定性的知识,就为粗糙集方法提供了用武之地;第三,数据库中的数据可能含有噪声,处理工具各有优缺点。其中,神经网络方法不能自动地选择合适的属性集,若利侍饷枋从这海量的、不确切的数据中提取带有知识性的信息,提取数据中存在的关系和常重要的一个方面。壳胺椒ǖ木窒扌据理论有时需要一些数据的附加信息或先验知识,如模糊隶属函数、基本概率指不确定的知识用