1 / 9
文档名称:

基于spss的聚类分析的实用方法+层次聚类法和迭代聚.doc

格式:doc   大小:23KB   页数:9页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于spss的聚类分析的实用方法+层次聚类法和迭代聚.doc

上传人:iris028 2019/12/22 文件大小:23 KB

下载得到文件列表

基于spss的聚类分析的实用方法+层次聚类法和迭代聚.doc

文档介绍

文档介绍:基于SPSS的聚类分析的实用方法层次聚类法和迭代聚基于SPSS的聚类分析的实用方法层次聚类法和迭代聚引用qjzhen001的基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)层次聚类法和迭代聚类法的主要区别在于:层次聚类法的聚类结果受奇异值的影响非常大,且聚类过程是单方向的,一旦某个样本进入某一类,就不可能从该类出来,再归入其他的类;迭代聚类法的聚类结果受奇异值和不合适的聚类变量的影响较小,对于不合适的初始聚类可以进行反复调整,但其缺点是聚类结果对初始聚类非常敏感,而且它也只能得到局部最优解.(一)层次聚类Analyze--C1assify--HierachicalCluster在"C1uster"组中选择聚类类型:要进行变量聚类选择指定"Vanables";要进行观测量聚类指定"Cases"。指定参与分析的变量,将选定的变量通过按钮箭头转移到箭头按钮右侧的"Variable[s]:"矩形框中;将标识变量通过下面一个箭头按钮转移到按钮右侧的"LabelCasesby:"下面的矩形框中。如果不使用系统默认值,或由于参与分析的变量量纲不一致需要指定选择项,则应该根据需要有选择性地执行下述某些步骤。,点击"Methed"按钮,展开分层聚类分析的方法选择对话框,即"HierachicalClusterAnalysis:Method"。在对话框中根据需要指定聚类方法、距离测度的方法、对数值进行转换方法,即标准化数值的方法和对测度的转换方法。(1)聚类方法选择"C1usterMethod:"表中列出可以选择的聚类方法:Between-groupslinkage组内连接Within-groupslinkage组内连接Nearestneighbor最近邻法Furthestneighbor最远邻法Centroidclustering重心聚类法Medianclustering中位数法Ward'smethodWard最小方差法。(后三种聚类方法应与欧氏距离平方法一起使用)几种方法的具体情况见下面的英文文档(2)对距离的测度方法选择在Method中指定的是用哪两点间的距离的大小决定是否合并两类。距离的具体计算方法还根据参与距离的变量类型从以下三种对话框选择其一,展开选择菜单后再进行具体方法的选择。这三个对话框分别对应于等间隔测度的变量(一般为连续变量)、计数变量(一般为离散变量)和二值变量。这里只考虑连续变量的情况"Interval"(系统默认)Euclideandistance:Euclidean距离,即两观察单位间的距离为其值差的平方和的平方根,该技术用于Q型聚类;SquaredEuclideandistance:Euclidean距离平方,即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类;Cosine:变量矢量的余弦,这是模型相似性的度量;Pearsoncorrelation:相关系数距离,适用于R型聚类;Chebychev:Chebychev距离,即两观察单位间的距离为其任意变量的最大绝对差值,该技术用于Q型聚类;Block:City-Block或Manhattan距离,即两观察单位间的距离为其值差的绝对值和,适用于Q型聚类;Minkowski:距离是一个绝对幂的度