文档介绍:第九章知识发现
粗糙集
史忠植
中科院计算所
11/10/2017
1
高级人工智能史忠植
内容
一、概述
二、知识分类
三、知识的约简
四、决策表的约简
五、粗糙集的扩展模型
六、粗糙集的实验系统
11/10/2017
2
高级人工智能史忠植
一、概述
现实生活中有许多含糊现象并不能简单地用真、假值来表示﹐如何表示和处理这些现象就成为一个研究领域。(Vague)一词,他把它归结到边界线上,也就是说在全域上存在一些个体既不能在其某个子集上分类,也不能在该子集的补集上分类。
11/10/2017
3
高级人工智能史忠植
模糊集
1965年,Zadeh提出了模糊集,,但模糊集理论采用隶属度函数来处理模糊性,而基本的隶属度是凭经验或者由领域专家给出,所以具有相当的主观性。
11/10/2017
4
高级人工智能史忠植
粗糙集的提出
20世纪80年代初,(Rough Set)﹐他把那些无法确认的个体都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之差集。由于它有确定的数学公式描述,完全由数据决定,,所以更有客观性。
11/10/2017
5
高级人工智能史忠植
粗糙集的研究
粗糙集理论的主要优势之一是它不需要任何预备的或额外的有关数据信息。自提出以来,许多计算机科学家和数学家对粗糙集理论及其应用进行了坚持不懈的研究,使之在理论上日趋完善,特别是由于20世纪80年代末和90年代初在知识发现等领域得到了成功的应用而越来越受到国际上的广泛关注。
11/10/2017
6
高级人工智能史忠植
粗糙集的研究
1991年波兰Pawlak教授的第一本关于粗糙集的专著《Rough Sets:Theoretical Aspects of Reasoning about Data 》,推动了国际上对粗糙集理论与应用的深入研究。1992年在波兰Kiekrz召开了第1届国际粗糙集讨论会。从此每年召开一次与粗糙集理论为主题的国际研讨会。
11/10/2017
7
高级人工智能史忠植
研究现状分析
史忠植. 知识发现. 北京: 清华大学出版社, 2002
刘清. Rough Set及Rough推理. 北京: 科学出版社, 2001
张文修等. Rough Set理论与方法. 北京: 科学出版社, 2001
王国胤, Rough Set理论与知识获取. 西安: 西安交通大学出版社, 2001
曾黄麟. 粗集理论及其应用(修订版). 重庆: 重庆大学出版社, 1998
11/10/2017
8
高级人工智能史忠植
研究现状分析
2001年5月在重庆召开了“第1届中国Rough集与软计算学术研讨会”,邀请了创始人Z. Pawlak教授做大会报告;
2002年10月在苏州第2届
2003年5月在重庆第3届,同时举办“第9届粗糙集、模糊集、数据挖掘和粒度-软计算的国际会议”因非典推迟到10月
中科院计算所、中科院自动化所、北京工业大学、西安交通大学、重庆邮电学院、山西大学、合肥工业大学、上海大学、南昌大学
11/10/2017
9
高级人工智能史忠植
二、知识分类
基本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。例如,在现实世界中关于环境的知识主要表明了生物根据其生存观来对各种各样的情形进行分类区别的能力。每种生物根据其传感器信号形成复杂的分类模式,就是这种生物的基本机制。分类是推理、学习与决策中的关键问题。因此,粗糙集理论假定知识是一种对对象进行分类的能力。这里的“对象”是指我们所能言及的任何事物,比如实物、状态、抽象概念、过程和时刻等等。即知识必须与具体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部分称之为所讨论的全域或论域(universe)。对于全域及知识的特性并没有任何特别假设。事实上,知识构成了某一感兴趣领域中各种分类模式的一个族集(family),这个族集提供了关于现实的显事实,以及能够从这些显事实中推导出隐事实的推理能力。
11/10/2017
10
高级人工智能史忠植