1 / 25
文档名称:

聚类分析sas.ppt

格式:ppt   大小:401KB   页数:25页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析sas.ppt

上传人:薛定谔的猫 2022/9/3 文件大小:401 KB

下载得到文件列表

聚类分析sas.ppt

相关文档

文档介绍

文档介绍:聚类分析sas程序
系统聚类的基本格式
PROCCLUSTERMETHOD=聚类方法<选项>;
Var变量名列表;
ID变量名;
Copy变量名列表;
By变量名;
Run;
指定的聚类方法有method=averave类平均
Centr聚类分析sas程序
系统聚类的基本格式
PROCCLUSTERMETHOD=聚类方法<选项>;
Var变量名列表;
ID变量名;
Copy变量名列表;
By变量名;
Run;
指定的聚类方法有method=averave类平均
Centroid重心法,complete最长距离法,
Single最短距离法,ward离差平方和法
Flexible可变类平均法
Median中间距离法
EML最大似然谱系法
系统聚类
选项
数据集选项
输入数据集data=sas数据集,默认最近生成的数据集
输出数据集outtree=sas数据集,生成用于画聚类树的数据集
控制聚类之前的数据处理
变量标准化standard
控制聚类过程信息的打印
noid禁止聚类过程中每次产生合并时打印id值
Print=n打印聚类过程的最后n层
例print=要求sas打印从个类到所有样品合并为个类时的聚类过程,默认打印全过程
Simple打印每个变量的描述统计量
语句
By语句对by变量定义的组分别做聚类分析
Id语句指定标示观测的变量,用于区分聚类历史中打印输出集ottree指定的数据集中的观测,若省略,则用obn表示,n为观测的序号
Copy语句把语句中指定的变量从输入数据集复制到outtree指定的输出数据集中
Var语句指出参与聚类分析的变量,默认所有数值变量参与分析
*
*
:
i
xi
-
-
-
-
xi
-
例中两个指标的量纲相同,可以不作标准化变换
x
x
*
*
datacluster;inputxx@@;
cards;
-----
;
procclusternoeigen/*不计算特征值*/rsquare
out=tremethod=single;varxx;
proctree;run;
*
*
SingleLinkageClusterAnalysis
Root-Mean-SquareTotal-SampleStandardDeviation=.
MeanDistanceBetweenObservations=.
NumberFrequencyNormalized
ofofNewemipartialMinimum
ClusClusJoiClusterR-SquaredR-SquaredDistanceTieterstersned
OBOB...T
OBOB...
OBCL...
OBOB...T
CLCL...
CLCL...
CLOB...
*
*
Root-Mean-SquareTotal-SampleStandardDeviation=.
MeanDistanceBetweenObservations=.
*
*
NumberFrequencyNormalized
ofofNewsemi-partialMinimum
ClusClusJoiClusterR-SquaredR-SquaredDistanceTieterstersned
OBOB...T
OBOB...
OBCL...
OBOB...T
CLCL...
CLCL...
CLOB...
新类号
类与类的连接
新类中样品数
半偏R方:数值大则上一次合