文档介绍:**,聚类之后的每个类别中任意两个数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度****:可伸缩性处理不同类型属性的能力发现任意形状聚类的能力减小对先验知识和用户自定义参数的依赖性处理噪声数据的能力可解释性和实用性**:划分聚类方法层次聚类方法基于密度的聚类方法基于网格的聚类方法****(Euclideandistance)曼哈顿距离(Manhattandistance)明考斯基距离(Minkowskidistance)**=SQRT(SUMXMY2({0,2},{,0}))**+a100a01a00a01+a00合计a11+a01a10+a00a11+a10+a01+a00****,u为样本xi和xj取值相同的属性个数