1 / 27
文档名称:

主成分分析 (2).ppt

格式:ppt   大小:444KB   页数:27页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析 (2).ppt

上传人:卓小妹 2022/3/27 文件大小:444 KB

下载得到文件列表

主成分分析 (2).ppt

相关文档

文档介绍

文档介绍:关于主成分分析 (2)
第一页,讲稿共二十七页哦
学****目标
了解主成分分析的数学模型;
熟悉主成分分析的方法步骤;
掌握主成分分析的作用和应用领域;
掌握PRINCOMP过程并运用此过程进行数据分析。
第二页,讲稿共二十七页由
解得每一特征值对应的特征向量,从而求得各主成分:
第十二页,讲稿共二十七页哦
主成分分析的方法步骤
计算主成分贡献率及累计贡献率
各主成分互不相关,即的相关系数:
于是,各主成分间的相关系数矩阵为单位矩阵。
一般地,主成分Zi的贡献率为:
第十三页,讲稿共二十七页哦
主成分分析的方法步骤
确定主成分的个数
当得到了k个主成分后,要根据确定主成分个数的准则和主成分的实际意义来确定主成分的个数。一般说,确定主成分个数的准则有两个:①以累积贡献率来确定:当前P个主成分的累积贡献率达到某一特定值时(一般采用70%~85%为准则),则保留前P个主成分。②根据特征值大小来确定,一般地,取特征值大于或等于1为准则。若有s个特征值大于或等于1,那么就可以确定主成分的个数为s个。一般可以将两种确定主成分个数的方法结合起来,选出有实际意义的主成分。
第十四页,讲稿共二十七页哦
主成分分析的方法步骤
计算主成分载荷
第i个主成分Zi的特征值的平方根与第j原始指标Xj的系数lij的乘积
为因子载荷。由因子载荷所构成的矩阵为因子载荷阵。实际数,因子载荷qij就是第i主成分Zi与第j原始指标Xj之间的相关系数,它反映了主成分Zi与原始指标Xj之间联系的密切程度与作用方向。
第十五页,讲稿共二十七页哦
主成分分析的方法步骤
计算主成分得分
如果标准化指标变量 的第i个主成分是:
其中, ,
是xj的标准化指标变量。那么,第i个主成分可以转换为原始指标变量的线性组合:
第十六页,讲稿共二十七页哦
主成分分析的应用
研究多个指标变量之间的依存关系,是医学研究中很重要的一件事情。但是,在研究多个指标变量之间的依存关系时,经常会遇到两个问题:①指标变量过多,使得分析难度增加;②变量之间的共线性存在,即变量之间不完全独立,这种情况造成分析结果不稳定或不正确。因此,解决自变量之间的多重共线性和减少变量个数对依存关系的分析就很重要了。
第十七页,讲稿共二十七页哦
主成分分析的应用
根据主成分分析原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法。另一方面,主成分分析可以用较少的变量取代较多的不独立的原变量,减少分析中变量的个数。概括地说,主成分分析有以下几方面的应用:
第十八页,讲稿共二十七页哦
主成分分析的应用
对原始指标进行综合:主成分分析的主要作用是在基本保留原始指标信息的前提下,以互不相关的较少个数的综合指标来反映原来指标所提供的信息。
探索多个原始指标对个体特征的影响:对于多个原始指标,求出主成分后,可以利用因子载荷阵的结构,进一步探索各主成分与多个原始指标之间的相互关系,分析各原始指标对各主成分的影响作用。
对样本进行分类:求出主成分后,如果各主成分的专业意义较为明显,可以利用各样品的主成分得分来进行样品的分类。
第十九页,讲稿共二十七页哦
主成份分析SAS程序
SAS系统中利用PRINCOMP过程对数据进行主成分分析。
PRINCOMP过程的语法格式如下:
PROC PRINCOMP DATA= OUT= OUTSTAT= NOINT COV N STD VARDEF [选项];
VAR 变量/[选项];
PARTIAL 变量;
RUN;
第二十页,讲稿共二十七页哦
主成份分析SAS程序
DATA语句指定要分析的数据集名及一些选项,它可以是原SAS数据集,也可以是corr、cov、ucorr、ucov等矩阵。
OUT选择项指定统计量的输出数据集名,该数据集保存的是样本的原始指标变量和主成分得分变量。
OUTSTAT指定输出结果的SAS数据集名,该数据集保存的是每一个指标的均值、标准差、样本数、相关系数矩阵、特征值和得分系数。
NOINT选择项指令系统使用未对均值校正的相关系数矩阵或方差协方差矩阵进行主成分分析,它等价于主成分模型中不含常数项。
第二十一页,讲稿共二十七页哦
主成份分析SAS程序
COV选择项指令系统用方差协方差矩阵计算主成分,如果该选择项缺省,系统用相关系数矩阵计算主成分。
N选择项给出主成分的个数。
STD选择项指令系统在输出数据集中,主成分得分变量的方差被标准化为1。
VAR语句用于列出要分析的原始变量。如果该语句缺省,系统分析其它