文档介绍:第 28卷第 11期计算机应用与软件 Vol
2011年 puterApplicationsandSoftware
基于类轮廓层次聚类方法的研究
孟海东唐旋
(内蒙古科技大学信息工程学院内蒙古包头 014010)
摘要传统的聚类算法在考虑类与类之间的连通性特征和近似性特征上往往顾此失彼。首先给出类边界点和类轮廓的基本定
义以及寻求方法,然后基于类间连通性特征和近似性特征的综合考虑,拟定一些类间相似性度量标准和方法,最后提出一种基于类
轮廓的层次聚类算法。该算法能够有效处理任意形状的簇,且能够区分孤立点和噪声数据。通过对图像数据集和 Iris标准数据集
的聚类分析,验证了该算法的可行性和有效性。
关键词连通性近似性类轮廓层次聚类
中图分类号 文献标识码 A
RESEARCHONCLASSPROFILEBASEDHIERARCHICALCLUSTERINGMETHOD
MengHaidong TangXuan
(SchoolofInformationEngineering,InnerMongoliaUniversityofScienceandTechnology,Baotou014010,InnerMongolia,China)
Abstract Traditionalclusteringalgorithmsareoftenincapableofroundlyconsideringtheconnectivityandsimilaritycharacteristicsamong
;secondly,prehensive
considerationbasedonconnectivitycharacteristicsandsimilaritycharacteristicsamongclasses,definessomestandardsandmethodsforinter
classsimilaritymeasurement;thirdly,proposesaclassprofilebasedhierarchicalclusteringalgorithm,whichisabletoeffectivelyprocess
clusteringanalysisonimagedatasetsandIrisstandarddatasets.
Keywords Connectivity Proximity Classprofile Hierarchicalclustering
性,但其主要缺点如下:(1)K-最近邻图中 K值的确定需要人
0 引言工进行;(2)最小二等分的选取困难;(3)相似度函数的阈值需
要人工给定[5]