1 / 3
文档名称:

聚类算法.doc

格式:doc   大小:76KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类算法.doc

上传人:phl808 2017/2/20 文件大小:76 KB

下载得到文件列表

聚类算法.doc

文档介绍

文档介绍:聚类分析聚类分析的基本思想是在样品之间定义距离, 在变量之间定义相似系数, 距离或相似系数代表样品或变量之间的相似程度。按相似程度的大小, 将样品( 或变量) 逐一归类, 关系密切的类聚到一个小的分类单位, 然后逐步扩大, 使得关系疏远的聚合到一个大的分类单位, 知道所有样品( 或变量) 都聚集完毕, 形成一个表示亲疏关系的谱系图, 依次按照某些要求对样品(或变量)进行分类。 1 分类统计量——距离与相似系数样品之间的相似性度量——距离用样品之间的距离来衡量各样品之间的相似程度。广义的距离有: 欧式距离、绝对距离、 Minkowski 距离、 Chebyshev 距离、方差加权距离和马氏距离。本仿真中用欧氏距离。 2 谱系聚类算法(层次聚类法) 谱系聚类法的思想:先将样品合成小类,再逐步扩大为大类。 合并距离 G p,G q 分别表示两个类, 设它们分别含有 n p,n q 各样品。若类 G p 中有样品 x 1,x 2,, …… x np ,则其均值为 11 rn p i ip x x n ???,称为类 G p 的重心。类 G p和G q 之间的距离记为 D pq。(1) 最短距离:类与类之间的距离为两类最近样品间的距离。(2) 最长距离:类与类之间的距离为两类最远样品间的距离。(3) 类平均距离:类与类之间的距离为两个类中所包含的节点距离的平均值。 1 p q pq ij i G j G p q D d n n ? ????(4) 中心距离:类与类之间的距离为两个类中心之间的距离。( , ) pq p q D d x x ?(5) W ard 距离:每次的合并保证同一类内的离差平方和最小。( ) ( ) p q T pq p q p q p q n n D x x x x n n ? ??? 步骤: (6) n 个样品开始时作为 n 个类,计算两两之间的距离,构成一个对称距离矩阵 D (0 )。(7) 选择 D (0 ) 中的非对角上的最小元素,将该对角元素对应的两个类合成一个类。同时在 D (0 ) 中消去对应的行和咧, 并加入新类与剩下的其未合并的类间的距离组成的一行和一列,得到一个新的距离矩阵,它是 n-1 阶方阵。(8) 重复第二步,直到达到合适的类数为止。 3模糊 C 均值聚类算法 思路给定数据集?? 1 2 , , n X x x x ?…,其中每个样本包含 s 个属性。 FCM 算法就是将数据集 X 划分到 c(2 c n ? ?) 个类中,?? 1 2 , , c v v v v ?…为c 个聚类中心。 FCM 的目标函数如下:??????? ci nj ij m ij ci UJ 1 2 1 1) ,..., ,( …………(1) 其中: u ij 表示第 j 个样本属于第 i 类的隶属度, 1 [