1 / 77
文档名称:

多元统计分析-.ppt

格式:ppt   大小:2,917KB   页数:77页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多元统计分析-.ppt

上传人:小落意心冢 2022/5/20 文件大小:2.85 MB

下载得到文件列表

多元统计分析-.ppt

文档介绍

文档介绍:多元统计分析-
2008年安全评价人员教育培训
距离和相似系数
相似性度量:距离和相似系数。
距离常用来度量样品之间的相似性,相似系数常用来度量变量之间的相似性。
样品之间的距离和相似系数有着各种不同的定义,而这些定义与变量的义及导出
设 为一个 维随机向量, ,
。考虑如下的线性变换
希望在约束条件 下寻求向量 ,使 得 达到最大, 就称为第一主成分。
设 为 的特征值,
为相应的单位特征向量,且相互正交。则可求得第一主成分为
它的方差具有最大值 。
如果第一主成分所含信息不够多,还不足以代表原始的 个变量,则需考虑再使用一个综合变 量 ,为使 所含的信息与 不重叠,应要求

我们在此条件和约束条件 下寻求向量 ,使得 达到最大,所求的 称为第二主成分。求得的第二主成分为

其方差为 。
一般来说, 的第 主成分是指:在约束条件 和 下寻求 ,使 得 达到最大。第 主成分为
主成分的性质


其中 ,即 ,且 互不相关。

由于


总方差中属于第 主成分 (或被 所解释)的比例为

称为主成分 的贡献率。
第一主成分 的贡献率最大,表明它解释原始变量
的能力最强,而 的解释能力依次递减。
主成分分析的目的就是为了减少变量的个数,因而一般是不会使用所有 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。
前 个主成分的贡献率之和

称为主成分 的累计贡献率,它表明
解释 的能力。
通常取(相对于 )较小的 ,使得累计贡献达到一个较高的百分比(如80%~90%)。此时,
可用来代替 ,从而达到降维的目的,而信息的损失却不多。
与主成分 之间的相关系数
在实际应用中,通常我们只对 与
的相关系数感兴趣。
从相关阵出发求主成分
样本的主成分
我们可以从协差阵 或相关阵 出发求得主成分。但在实际问题中, 或 一般都是未知的,需要通过样本来进行估计。设数据矩阵为

则样本协差阵和样本相关阵分别为
样本的主成分
一、样本主成分的定义
二、从 出发求主成分
三、从 出发求主成分
四、主成分分析的应用
五、若干补充及应用中需注意的问题
一、样本主成分的定义
若向量 在约束条件 下,使得的样本方差

达到最大,则称线性组合 为第一样本主成分。若向量 在约束条件 和
的样本协方差
下,使得 的样本方差

达到最大,则称线性组合 为第二样本主成分。一般地,若向量 在约束条件 和