文档介绍:. .
优选
系统聚类分析方法
聚类分析是研究多要素事物分类问题的数量方法。根本原理是根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进展聚类。
常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。
1. 聚类要素的数据处理
假设有m 个聚类的对象,每一个聚类对象都有 个要素构成。它们所对应的要素数据可用 。〔点击显示该表〕 在聚类分析中,常用的聚类要素的数据处理方法有如下几种。
①总和标准化
②标准差标准化
    ③极大值标准化
经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。
④极差的标准化
. .
优选
经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。
2. 距离的计算
距离是事物之间差异性的测度,差异性越大,那么相似性越小,所以距离是系统聚类分析的依据和根底。
①绝对值距离
选择不同的距离,聚类结果会有所差异。在地理分区和分类研究中,往往采用几种距离进展计算、比照,选择一种较为适宜的距离进展聚类。
. .
优选
例:,它们经过极差标准化处理后,。
,用绝对值距离公式计算可得九个农业区之间的绝对值距离矩阵:
. .
优选
3. 直接聚类法
直接聚类法是根据距离矩阵的构造一次并类得到结果。
▲ 根本步骤:
①把各个分类对象单独视为一类;
②根据距离最小的原那么,依次选出一对分类对象,并成新类;③如果其中一个分类对象已归于一类,那么把另一个也归入该类;如果一对分类对象正好属于已归的两类,那么把这两类并为一类;每一次归并,都划去该对象所在的列与列序一样的行;④那么,经过m-1次就可以把全局部类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。
★直接聚类法虽然简便,但在归并过程中是划去行和列的,因而难免有信息损失。因此,直接聚类法并不是最好的系统聚类方法。
[举例说明]〔点击翻开新窗口,显示该容〕
例:九个农业区之间的绝对值距离矩阵,使用直接聚类法做聚类分析。
解:
根据上面的距离矩阵,用直接聚类法聚类分析:
第一步,在距离矩阵D中,除去对角线元素以外,d49=d94=,故将第4区与第9区并为一类,划去第9行和第9列;
第二步,在余下的元素中,除对角线元素以外,d75= d57=,故将第5区与第7区并为一类,划掉第7行和第7列;
第三步,在第二步之后余下的元素之中,除对角线元素以外,d82= d28=,故将第2区与第8区并为一类,划去第8行和第8列;
第四步,在第三步之后余下的元素中,除对角线元素以外,d43= d34=,故将第3区与第4区并为一类,划去第4行和第4列,此时,第3、4、9区已归并为一类;
第五步,在第四步之后余下的元素中,除对角线元素以外,d21= d12=,故将第1区与第2区并为一类,划去第2行和第2列,此时,第1、2、8区已归并为一类;
第六步,在第五步之后余下的元素中,除对角线元素以外,d65= d56=,故将第5区与第6区并为一类,划去第6行和第6列,此时,第5、6、7区已归并为一类;
第七步,在第六步之后余下的元素中,除对角线元素以外,d31= d13=,故将第1区与第3区并为一类,划去第3行和第3列,此时,第1、2、3、4、8、9区已归并为一类;
第八步,在第七步之后余下的元素中,除去对角线元素以外,只有d51= d15=,故将第1区与第5区并为一类,划去第5行和第5列,此时,第1、2、3、4、5、6、7、8、9、区均归并为一类;
根据上述步骤,可以做出直接聚类谱系图。〔点击展开显示该图〕
. .
优选
4. 最短距离聚类法
. .
优选
最短距离聚类法是在原来的m×m距离矩阵的非对角元素中找出 ,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式
计算原来各类与新类之间的距离,这样就得到一个新的〔m-1〕阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。
[举例说明