1 / 32
文档名称:

主成分分析.ppt

格式:ppt   大小:792KB   页数:32页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析.ppt

上传人:wz_198613 2019/7/17 文件大小:792 KB

下载得到文件列表

主成分分析.ppt

文档介绍

文档介绍:第九章主成分分析 ponent第二节主成分分析的计算步骤第一节主成分分析的意义和原理第三节一些供实际应用时参考的意见第一节主成分分析的作用和原理 Function&Theory主成分分析的意义主成分分析是一种对多元数据的变量数目进行有效减维压缩的方法。它提供了一种能在保持原资料大部分信息的基础上,将变量数较多而且变量间有不同程度相关关系的数据转换成一组变量数较少而且变量间相互独立的新数据的方法。生成的每个新变量解释了样本的某个方面或某些方面的变异情况,对进一步分析评价样本提供了理论依据****惯做法是:每个变量给一个得分,每品种加得一个总分。用总分比较不同品种。但由于这20个变量不是互相独立、同步变化的,将它们的得分直接相加是勉强的。主成分分析提供了一种数据转换方法。第一节主成分分析的作用和原理 Function&Theory主成分分析的意义主成分分析是一种对多元数据的变量数目进行有效减维压缩的方法。它提供了一种能在保持原资料大部分信息的基础上,将变量数较多而且变量间有不同程度相关关系的数据转换成一组变量数较少而且变量间相互独立的新数据的方法。主成分分析提供了一种数据转换方法。第一节主成分分析的作用和原理 Function&Theory主成分分析的原理先讨论只有两个变量的情况。设有个样本,每样本观察了和两个变量。为简单起见,设和的平均数都是0。以为横轴,为纵轴,作图如下。由于和之间有密切的相关关系,大部分点在第1、3象限。以坐标原点为中心,将坐标轴作适当旋转,让新的横坐标与原来的回归线重合。记新的横轴为纵轴为,图形变成右下图。现在四个象限中的点数基本相同,说明和几乎没有相关。资料结构不变,只是坐标轴旋转了,所以总方差不变,即。而右图中,的变异比的变异大的多。如果的变异小到可以认为是由误差造成的,则只需用就足以说明问题。第一节主成分分析的作用和原理 Function&Theory于是问题变成,对于组,要寻找合适的、、和使得数据变换或记为Z=;具有以下性质:,解释了剩余的小量变异,变异用方差表示。当自由度相同时,也可以用平方和来表示。即占绝大比例占极小比例第一节主成分分析的作用和原理 Function&Theory或记为Z=;具有以下性质:推广到多于两个变量的情况。设有个样本,每样本观察了等个平均数为0的性状。如果能够找到合适的使得线性转换...……………,解释了解释后剩余的变异中的大部分变异,解释了解释后剩余的变异中的大部分变异,…,直到将原数据的总变异全部解释完毕。第一节主成分分析的作用和原理 Function&;,解释了解释后剩余的变异中的大部分变异,解释了解释后剩余的变异中的大部分变异,…,直到将原数据的总变异全部解释完毕。变异:方差协方差矩阵由左面变成了右面的样子:按性质的要求:总变异不变,即两矩阵的迹相等:并且。称为第一主成分,为第二主成分,…,为第主成分。如果前面个主成分已解释了总变异的绝大部分。即已占的绝大部分,剩余部分可认为是误差,则只需要保留前个主成分。;;、特征向量、各特征根的方差贡献率和累计方差贡献率;,并利用它们的特征向量来构成主成分的结构式;;,可用特征根的平方根(即主成分的标准差)除主成分得分,将其化为标准化主成分得分;。()30个小麦品种的10个性状:抽穗期(天);株高(cm);单株穗数(穗);主穗长(cm);主穗粒数(粒);穗下节长(cm);主穗小穗数(穗);每小穗粒数(粒);单株粒重(g);百粒重(g);研究的目的:是想将数据进行减维压缩,然后将这30个品种的优劣进行排队比较。;;、特征向量、各特征根的方差贡献率和累计方差贡献率;,并利用它们的特征向量来构成主成分的结构式;;,可用特征根的平方根(即主成分的标准差)除主成分得分,将其化为标准化主成分得分;。资料总方差=++…+=