1 / 16
文档名称:

聚类分析(快速聚类和变量聚类) 上机指导.doc

格式:doc   大小:200KB   页数:16页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析(快速聚类和变量聚类) 上机指导.doc

上传人:tswng35 2020/7/28 文件大小:200 KB

下载得到文件列表

聚类分析(快速聚类和变量聚类) 上机指导.doc

文档介绍

文档介绍:实验六聚类分析——动态聚类和变量聚类二、动态聚类法——FASTCLUS过程动态聚类又称为逐步聚类,基本思想是,开始先粗略地分一下类(先选一批凝聚点,让样品向最近的凝聚点聚集,就得到初始分类),然后按照某种最优的原则修改不合理的分类,直到分得比较合理为止。FASTCLUS过程的一般格式:PROCFASTCLUSMAXCLUSTER=n|RADIUS=t<options>;VARvariables;IDvariable;FREQvariable;WEIGHTvariable;BYvariables;语句说明:PROCFASTCLUS语句用来开始FASTCLUS过程,必须规定说明项MAXCLUSTER=或RADIUS=中的一个。说明项和常用选项:MAXCLUSTER=n|MAXC=n:指定所允许的最大分类数,=t:为选择新的“凝聚点”指定的最小距离准则。当一个观测点与已有“凝聚点”的最小距离均大于由该选项规定的值t时,该观测可考虑用来作为新的“凝聚点”。=SAS-data-set:给出进行聚类的观测数据集的名字。OUT=SAS-data-set:聚类结果保存都新的数据集中,包含VAR中变量,及新变量cluster和distance(观测与所属类间的距离)。CLUSTER=name:规定在输出的数据集中用以指示观测属于哪一类的变量名字。:执行逐个修改法MAXITER=n:指定重新计算类的凝聚点的最大迭代次数。当n>0时,执行按批修改法。:要求输出类均值之间的距离LIST:要求列出所有观测所归入类的类号及观测同最终凝聚点之间的距离。注意事项:应用举例:例2:试用FASTCLUS过程对16个地区农民生活水平的调查数据(数据集d641)进行分类。SAS程序:procfastclusdata=d641out=out653maxc=4list;varx1-x6;idgroup;run;maxc=4:规定最大分类个数为4类list:要求列出分类结果。out=out653:指定生成名为out653的输出数据集,包含VAR中的变量,新变量cluster和新变量distance(观测与所属类中心的距离)。主要输出结果:动态聚类的初始凝聚点(数据不标准化)动态聚类的分类结果(数据不标准化)第一类:、第二类:第三类:、、、、第四类:蒙、、、、、、动态聚类产生的各类均值和标准差(数据不标准化)以下SAS程序首先调用STANDARD过程对数据作标准化变化,然后用标准化变换后的数据进行动态聚类分析。Procstandarddata=d641mean=0std=1out=sta653;Varx1-x6;/*将数据集d641中的变量x1-x6标准化,输出到数据集sta653中*/Procfastclusdata=sta653out=out654maxc=4list;Varx1-x6;idgroup;Run;主要输出结果:动态聚类的初始凝聚点(数据标准化)动态聚类的分类结果(数据标准化)第一类:第二类:第三类:、、蒙、、第四类:天津、、、、、、、、三、变量聚类——VARCLUS过程VARCLUS过程的一般格式:PROCVARCLUS语句及选项:数据集选项:DATA=SAS-data-set:指定要分析的数据集,数据集可以是通常的SAS数据集或是TYPE=CORR,UCORR(矫正过的相关系数矩阵),COV,UCOV等的数据集。OUTSTAT=SAS-data-ste:生成一个输出数据集,包含均值、标准差、相关系数、类得分系数和类的结构。OUTTREE=SAS-data-set:生成输出数据集,包含有聚类过程的树状结构信息,可用TREE过程画树状图。确定分类个数的选项:MAXCLUSTERS=n|MAXC=n:规定所要求的最大分类个数,缺省为变量个数。MINCLUSTERS=n|MINC=n:规定所要求的最小分类个数,缺省从一个类开始试着按照选项PROPORTION=或者MAXEIGEN=进行分裂分类MAXEIGEN=n:规定每一类第二特征值所允许的最大值,缺省,若没有规定选项PROPORTION=或MAXC=,且输入数据集为相关阵时,缺省值为1;若输入数据集为协方差阵时,缺省值为变量方差的均值。该选项不能与CENTROID同时使用PROPORTION=n|PERCENT=n:规定类分量必须解释的方差比例或百分比。若指定选项CENTROID,,否则为0聚类方式选项:CENTROID:使用重心分量而不是主分量,缺省为主分量法MAXITER=n:规定最大迭代次数,若规定了CENTROID,缺省为1,否则,缺省为10控制输出的选项:CORR|C:只输出相关

最近更新

优秀青年个人事迹材料范文(15篇) 25页

低碳环保建议书 5页

苏教版六年级下册《反比例的意义》PPT课件 12页

2023年供应链物流管理试题库 6页

2023年版金属非金属矿山(地下矿山)安全管理人.. 24页

EPC工程总承包合同常见的6类价款争议每一步都.. 4页

《20以内的退位减法》单元教学设计 17页

《桃花源记》教案优秀6篇 23页

【假期阅读技能提升训练】小学语文三年级下册.. 6页

三年级信息技术测试题 4页

个人能力提升计划书15篇 38页

中药学题库及答案 45页

五年级奥数寒假讲义 20页

能量养生帝妃思调理身体小知识PPT课件 10页

全国统一新2021届高考英语试卷和答案解析(新课.. 18页

公路养护安全培训 10页

关于赔偿协议书范文十篇 12页

初一美术教学总结(精选4篇) 6页

双减背景下小学道德与法治作业设计探究 8页

商务礼仪培训心得体会4篇 7页

水箱维修合同范本 21页

《中学生体质健康状况调查》综合实践活动方案 24页

晨读午写检查表 2页

党的历史知识竞赛题库试题及答案(1680题,含.. 459页

北京高考语文背诵与默写篇目(已标出重点句) 12页

重大安全隐患台账模板 9页

八年级音乐下册 第2单元《八音和鸣(四)》2 .. 15页

中小学实验室管理和实验教学工作评估细则 4页

Q/GDW 173-2008 《架空输电线路状态评价导则.. 30页

歌剧《蒂托的仁慈》中咏叹调《我走,我走》的.. 41页