1 / 74
文档名称:

聚类分析-动态聚类.ppt

格式:ppt   大小:724KB   页数:74页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析-动态聚类.ppt

上传人:新起点 2016/10/25 文件大小:724 KB

下载得到文件列表

聚类分析-动态聚类.ppt

相关文档

文档介绍

文档介绍:1第六章聚类分析2?系统聚类分析直观,易懂。?动态聚类快速,动态。?有序聚类保序(时间顺序或大小顺序)。3一、变量测量尺度的类型为了将样本进行分类,就需要研究样品之间的关系;而为了将变量进行分类,就需要研究变量之间的关系。但无论是样品之间的关系,还是变量之间的关系,都是用变量来描述的,变量的类型不同,描述方法也就不同。通常,变量按照测量它们的尺度不同,可以分为三类。§2 距离和相似系数4(1)间隔尺度。指标度量时用数量来表示,其数值由测量或计数、统计得到,如长度、重量、收入、支出等。一般来说,计数得到的数量是离散数量,测量得到的数量是连续数量。在间隔尺度中如果存在绝对零点,又称比例尺度。5(2)顺序尺度。指标度量时没有明确的数量表示,只有次序关系,或虽用数量表示,但相邻两数值之间的差距并不相等,它只表示一个有序状态序列。如评价酒的味道,分成好、中、次三等,三等有次序关系,但没有数量表示。又如评价产品的质量,虽可用一、二、三等来表示,但一等与二等之间、二等与三等之间的差距并不一定相等。6(3)名义尺度。指标度量时既没有数量表示也没有次序关系,只有一些特性状态,如眼睛的颜色,化学中催化剂的种类等。在名义尺度中只取两种特性状态的变量是很重要的,如电路的开和关,天气的有雨和无雨,人口性别的男和女,医疗诊断中的“+”和“-”,市场交易中的买和卖等都是此类变量。显然,对于具有多个特性状态的变量,可通过并类的方法将其转化为二性状态变量。7二、数据的变换处理所谓数据变换,就是将原始数据矩阵中的每个元素,按照某种特定的运算把它变成为一个新值,而且数值的变化不依赖于原始数据集合中其它数据的新值。81、中心化变换中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。设原始观测数据矩阵为:?????????????npnnppxxxxxxxxx??????2**********Xjijijxxx??*令),,3,2,1;,,3,2,1(pjni????9中心化变换的结果是1. 使每列之和均为0,即每个变量的均值为0;2. 协方差阵不变;3. 每列数据的平方和是该列变量样本方差的(n-1)倍;4. 任何不同两列数据之交叉乘积是这两列变量样本协方差的(n-1)倍,所以这是一种很方便地计算方差与协方差的变换。102、极差正规化变换正规化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差,就得到正规化数据。即有:jniijijijRxxx,,2,1*)min(????),,3,2,1;,,3,2,1(pjni????niijijnijxxR,,2,1,,2,1)min()(max??????10*??ijx