文档介绍:数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据发掘原理与算法教课设计
讲解:王志明
w3z2m
湖南农业大学理学院信息科学系
数据挖掘原理与算法教案
数据是一四元组
S=(U,A,V,f ) 的定义为 :
U:是一个非空有限对象 ( 元组 ) 会合 ,
U={x1 x2 xn}, 此中 xi 为对象 ( 元组 ) 。
是对象的属性会合 ,A={A1,A2, ,An},A 常分为两个不订交的子集 ,
即条件属性 C和决议属性 D, A C D
V: 是属性值的会合, V={V1,V2, ,Vn},Vi 是 Ai 的值域。
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
:是信息函数, f: U A V , f ( xi , Aj ) Vj
对于 A中随意一个属性 a, 若两记录 ei 和 ej 它们的属性值相同,称 ei 和 ej
是对属性 a 的等价关系。属于同一等价关系的归位一个等价类。
2、上近似和下近似
、设 U是对象(案例)的会合 U={x1 x2 xn} ;B 是属性集 A的子集, R(B)是 U上的二元等价关系,
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
R(B)
{( x1
, x2 ) | f (x1,b)
f (x2 , b),b
B}
,
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
若对随意会合 O,B是属性集 A 的子集,则
BO { x U |[ x] O}, 这里 [ x] 表示 x
R( B) R( B)
O的下近似定义为:
在 R(B)上的等价类。
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
上近似定义为: BO { x U |[ x]R( B ) O },
、约简
设有两属性集 B1, B2 , B1是 B2 的真子集,假如 R( B1 ) R( B2 ) ,则称 B2 可归约为 B1 ,若属性集 B 不行归约,则称 B 为 U的一个约简或归约子。
、依靠度
设有两属性集 P 和 Q,则 P 对 Q的属性依靠度定义为:
rp (Q)
# posp (Q ) ,此中 posp (Q)
PX ,PX 表示会合 X 在属性集上的下近
#U
x R* (Q )
似。
设 B C ,C是条件属性和 D是决议属性 , 则属性重要度定义为:
全集 U能够区分为三个不订交的地区,即正域( Pos),负域(NEG)和界限( BND):
从上边可见: A( X ) A( X ) BND A ( X )
用图说明正域、负域和界限,每一个小长方形表示一个等价类。
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
正域、负域和界限
NEG(X)
Pos(X)=
A ( X )
X
BND(X)
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
正域
负域
界限
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
5、粗拙集
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
不然
若 A( X ) A( X ) ,即 BND (X )
X 为 A 不行定义的,即 A( X )
,即界限为空,称 A( X ) ,称 X 为 A 的
X 为 A 的可定义集;
Rough集(粗拙集)。
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
6、规则的提取
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案
经过剖析
U中的两个区分
C
{ Ei }
和 D
{ Yj }
之间的关系,把
C视为分类
数据挖掘原理与算法教案
数据挖掘原理与算法教案
数据挖掘原理与算法教案