文档介绍:一种基于粒度分析原理的模糊聚类算法*) A Fuzzy ClusteringAlgorithm Based on Granular Analysis 赵权1’ (山西大学计算智能与中文信息处理省部共建教育部重点实验室太原030006)1 (山西大学计算机与信息技术学院太原030006)2 A五刚[ract Based On maⅪ algorithm withthefixed number ofclustersandfuzzye-nleal'塔algorithm·a new ftgzy clustering algorithm based ongranular analysis proposed through themeasure otcoupling degree andclosenessde- greeofwhichexperimental resultsdemonstrate the Keywerds Coupling degree,Closeness degree。Granular clustering,Fuzzy clusteringalgorithm 引言聚类分析作为一种非监督学****方法,是智能计算领域中的一个重要的研究方向。同时,聚类技术也是数据挖掘中进行数据处理的重要分析工具和方法[1’2]。聚类模型和聚类算法的设计是整个聚类分析过程中最关键的步骤,设计不同的聚类模型,就可以得到不同的聚类算法。目前出现的聚类算法主要有[3~5]:基于层次的方法、基于划分的方法、基于密度的方法和基于网格的方法等。聚类分析本身隐含着粒度的思想,因此将聚类与粒度原理相结合的研究近年来引起了国内外的广泛关注。国际上,Pedrycz.[6]在粒度计算方法学、信息粒化算法、聚类意义下的粒度世界描述等方面做了系统的研究。Raghavan[7]提出了一种聚类算法来构造最优的粒原型。Su[8]将粒度分析原理与聚类算法相结合,提出了一种通过信息粒度获取知识的模型。在国内,卜东波[9]等论述了聚类和分类中的粒度原理,并提出了一种有效的非均匀粒度分类方法。徐峰E103等讨论了模糊商空间的聚类,从不同层次、不同角度合成聚类结果,认为聚类可以以非均匀粒度来描述样本集。张讲社[11]等提出了基于视觉模拟展现原理的聚类算法,算法中隐含着重要的粒度选择思想。,聚类结果就是在数据的粒度空间中选择一个(合适)粒度。将某种准则下的粒度选择原理、粒度特性评价思想与聚类分析相结合来解决聚类分析中重要问题。因此,发展基于粒度分析原理的聚类算法将成为聚类分析领域的研究热点。本文给出了信息粒耦合度测度与贴近度测度的定义,提出了一种新的基于粒度分析原理的模糊聚类算法。该算法利用基于确定类别数的最大最小距离算法构造初始聚类中心,引入隶属度矩阵调整聚类中心,采用模糊迭代方法得到较优的聚类结果。 2信息粒度的相关知识 设给定论域L,和U上的一个关系 R:(【,),U—UGi,r为正整数集,则称Gf为一个信息粒,{G}妇是论域的一种粒度。其中,P (U)表示论域U的幂集,R可代表等价关系、不可区分关系、功能相近关系、相似关系、相等关系、约束、相容关系、复合