文档介绍:1
2 2 2 2
nts , the smaller the gravitation acted on noise data points —this is regarded as a quality result
and vice versa. Experiments conducted on several datasets verify the validity and high efficiency of
the proposed algorithm which can get an evaluation value to reflect whether the clustering result is
of good or poor quality. Furthermore , the proposed algorithm can lead the clustering algorithm to
find the best result automatically without any manual interference.
Key words : clustering ; clustering result evaluation ; gravitation ; clustering algorithm ; data
mining
聚类分析是数据挖掘技术中的重要组成部分· 念的聚类质量评估算法 ,该算法能够有效评估聚
聚类算法[1 - 4 ] 的主要目的是将数据空间中的数 类结果的质量 ,同时还具有较高的运行效率·
据点划分为若干个类 ,其中距离相近的数据点被
1 聚类质量评估算法介绍
划分在相同的类中 ,距离较远的点被划分到不同
[5 - 7 ]
的类中·聚类质量评估算法 是用于评估聚类 当数据空间中数据点分布情况比较复杂并且
结果质量的·由于不同的聚类算法对相同的数据 存在一定数量的噪音数据时 ,各种聚类算法产生
集聚类的结果往往不同 ,即使相同的算法用不同 的聚类结果往往不同·本文介绍的聚类质量评估
的聚类参数聚类相同数据集也会得出不同的聚类 算法 ,以万有引力为基础 ,将数据集中的数据点看
结果 ,这时就需要用聚类质量