1 / 52
文档名称:

数据分析实验3.ppt

格式:ppt   大小:680KB   页数:52页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据分析实验3.ppt

上传人:孔乙己 2022/6/28 文件大小:680 KB

下载得到文件列表

数据分析实验3.ppt

相关文档

文档介绍

文档介绍:数据分析实验3
PROC PRINCOMP
Proc princomp options;
prefix=name:规定各主成分的名称的前缀。省略此句则sas系统自动赋予各主成分名称分别为prin1,prin2,…。:在选择“METHOD=NORMAL”的前提下,“POOL=YES”意味着假定各总体的协方差矩阵相等,而用各训练样本的样本协方差矩阵联合估计公共的协方差矩阵,这时建立的判别函数是线性的;若假定“ POOL=NO”,则意味着假定各总体的协方差矩阵不等而建立二次判别函数; “ POOL=TEST”即要求首先利用修正的Bartlett似然比方法检验各总体的协方差矩阵是否相等,若检验结果在由语句“SLPOOL=p”所指定的显著水平p下显著,则建立二次判别函数,否则利用联合协方差矩阵估计建立线性判别函数。对线性判别函数,输出结果中才给出判别函数的系数。
PROC DISCRIM
PROC DISCRIM options;
此语句中,“options”部分可包含下列内容:
3)判别分析方法的选择:
SLPOOL=p:指定检验协方差矩阵是否相等的显著水平。只有当选择“POOL=TEST”时,才可出现此语句,若省去此语句,则SAS系统默认p=。
PROC DISCRIM
PROC DISCRIM options;
此语句中,“options”部分可包含下列内容:
4)回判结果输出选择:
LIST:打印出每个样品的回判结果;
LISTERR:仅打印出回判中判错的样本信息;
NOCLASSIFY:不需要对训练样本数据作回判分析。
PROC DISCRIM
PROC DISCRIM options;
此语句中,“options”部分可包含下列内容:
5)交叉确认法回判结果的输出选择:
当下列语句出现时,则交叉确认法被使用对训练样本作出回判分析。
CROSSVALIDATE:要求对训练样本数据集进行交叉确认回判分析;
CROSSLISTERR:仅打印出使用交叉确认法判别而判错的样本信息;
CROSSLIST:打印出每个样品的交叉确认法回判分析结果。
PROC DISCRIM
PROC DISCRIM options;
此语句中,“options”部分可包含下列内容:
6)检验数据集判别结果的输出选择:
TESTLIST:列出对检验数据集的判别结果;
TESTLISTERR:仅列出对检验数据集中判错的样品信息。
PROC DISCRIM
PROC DISCRIM options;
此语句中,“options”部分可包含下列内容:
7)控制打印结果
WCORR(WCOV):打印各总体的训练样本相关(协方差)矩阵;
PCORR(PCOV):打印由各总体的样本相关矩阵所得的联合相关(协方差)矩阵估计;
ALL:打印出所有的相关结果;
SHORT:只打印一些主要结果。
PROC DISCRIM
CLASS variable;
其中的“variable”即描述各类别的变量名称。该变量可以是数值化变量、也可以是非数值变量。该语句是进行判别分析所必需的语句。
VAR variable;
其中的“variable”即列出参与分析的描述各种样品特征的变量名称,省略时即数据集中所有的数值变量。
PROC DISCRIM
PRIORS probabilities;
此语句的功能即指出总体的先验概率分布。其中的“probabilities”应是下列三种选择之一:
EQUAL:即各总体的先验概率相等;
PROPORTIONAL(或PROP):即各总体的先验概率与各总体的训练样本容量成比例。
PROC DISCRIM
PRIORS probabilities;
具体指定各总体的先验概率:
(即“CLASS variable”中的变量)是非数值变量,则在各类取值后给出先验概率并用等号连起来。
例:描述各总体类别的变量“GRADE”取A,B,C,D四个值,,
,,则
PRIORS A= B= C= D=;
PROC DISCRIM
PRIORS proba