1 / 132
文档名称:

聚类分析和判别分析.ppt

格式:ppt   大小:4,823KB   页数:132页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析和判别分析.ppt

上传人:卓小妹 2022/3/24 文件大小:4.71 MB

下载得到文件列表

聚类分析和判别分析.ppt

相关文档

文档介绍

文档介绍:聚类分析和判别分析
第1页,此课件共132页哦
聚类分析与判别分析的基本概念

层次聚类分析中的Q型聚类

层次聚类分析中的R型聚类

快速聚类分析


第16页,此课件共132页哦
样本若有k个变量,则可以将样本看成是一个k维的空间的一个点,样本和样本之间的距离就是k维空间点和点之间的距离,这反映了样本之间的亲疏程度。聚类时,距离相近的样本属于一个类,距离远的样本属于不同类。
1.连续变量的样本距离测量方法
第17页,此课件共132页哦
(1)欧氏距离(Euclidean Distance)
两个样本之间的欧氏距离是样本各个变量值之差的平方和的平方根,计算公式为
第18页,此课件共132页哦
(2)欧氏距离平方(Squared Euclidean Distance)
两个样本之间的欧氏距离平方是各样本每个变量值之差的平方和,计算公式为
第19页,此课件共132页哦
(3)Chebychev距离
两个样本之间的Chebychev距离是各样本所有变量值之差绝对值中的最大值,计算公式为
第20页,此课件共132页哦
(4)Block距离
两个样本之间的Block距离是各样本所有变量值之差绝对值的总和,计算公式为
第21页,此课件共132页哦
(5)Minkowski距离
两个样本之间的Minkowski距离是各样本所有变量值之差绝对值的p次方的总和,再求p次方根。计算公式为
第22页,此课件共132页哦
(6)Customized距离(用户自定义距离)
两个样本之间的Customized距离是各样本所有变量值之差绝对值的p次方的总和,再求q次方根。计算公式为
第23页,此课件共132页哦
连续变量亲疏程度的度量,除了上面的各种距离外,还可以计算其他统计指标。如Pearson相关系数、Sosine相似度等。
2.连续变量的样本亲疏程度的其他测量方法
第24页,此课件共132页哦
第25页,此课件共132页哦
3.顺序或名义变量的样本亲疏程度测量方法
对于此类变量,可以计算一些有关相似性的统计指标来测定样本间的亲疏程度。也可以通过下面两个计算公式来得到。
第26页,此课件共132页哦
第27页,此课件共132页哦
第28页,此课件共132页哦
4.样本数据与小类、小类与小类之间的亲疏程度测量方法
SPSS默认的变量为Var00001、Var00002等,用户也可以根据自己的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下。
第29页,此课件共132页哦
所谓小类,是在聚类过程中根据样本之间亲疏程度形成的中间类,小类和样本、小类与小类继续聚合,最终将所有样本都包括在一个大类中。
在SPSS聚类运算过程中,需要计算样本与小类、小类与小类之间的亲疏程度。SPSS提供了多种计算方法(计算规则)。
第30页,此课件共132页哦
(1)最短距离法(Nearest Neighbor)
以当前某个样本与已经形成小类中的各样本距离的最小值作为当前样本与该小类之间的距离。
第31页,此课件共132页哦
(2)最长距离法(Furthest Neighbor)
以当前某个样本与已经形成小类中的各样本距离的最大值作为当前样本与该小类之间的距离。
第32页,此课件共132页哦
(3)类间平均链锁法(Between-groups Linkage)
两个小类之间的距离为两个小类内所有样本间的平均距离。
第33页,此课件共132页哦
(4)类内平均链锁法(Within-groups Linkage)
与小类间平均链锁法类似,这里的平均距离是对所有样本对的距离求平均值,包括小类之间的样本对、小类内的样本对。
第34页,此课件共132页哦
(5)重心法(Centroid Clustering)
将两小类间的距离定义成两小类重心间的距离。每一小类的重心就是该类中所有样本在各个变量上的均值代表点。
第35页,此课件共132页哦
(6)离差平方和法(Ward’s Method)
小类合并的方法:在聚类过程中,使小类内各个样本的欧氏距离总平方和增加最小的两小类合并成一类。
第36页,此课件共132页哦
 研究问题
对一个班同学的数学水平进行聚类。聚类的依据是第一次数学考试的成绩和入学考试的成绩。数据如表8-1所示。
SPSS中实现过程
第37页,此课件共132页哦
表8-1 学生的数学成绩
姓 名
数 学
入 学 成 绩