1 / 63
文档名称:

主分量分析.ppt

格式:ppt   大小:2,631KB   页数:63
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主分量分析.ppt

上传人:shidongliao_666 2022/7/6 文件大小:2.57 MB

下载得到文件列表

主分量分析.ppt

相关文档

文档介绍

文档介绍:This template is the internal standard courseware template of the enterprise
主分量分析
第一节 主分量分析
概 述
主分量分析的基本原理
主分量分析虑只保留这些点的长轴属性,来区分椭圆上的点,这样,区分性比x,y轴的方法要好!
所以我们的做法就是求得一个k维特征的投影矩阵,这个投影矩阵可以将特征从高维降到低维。投影矩阵也可以叫做变换矩阵。新的低维特征必须每个维都正交,特征向量都是正交的。通过求样本矩阵的协方差矩阵,然后求出协方差矩阵的特征向量,这些特征向量就可以构成这个投影矩阵了。特征向量的选择取决于协方差矩阵的特征值的大小。
举一个例子:
    对于一个训练集,100个样本,特征是10维,那么它可以建立一个100*10的矩阵,作为样本。求这个样本的协方差矩阵,得到一个10*10的协方差矩阵,然后求出这个协方差矩阵的特征值和特征向量,应该有10个特征值和特征向量,我们根据特征值的大小,取前四个特征值所对应的特征向量,构成一个10*4的矩阵,这个矩阵就是我们要求的特征矩阵,100*10的样本矩阵乘以这个10*4的特征矩阵,就得到了一个100*4的新的降维之后的样本矩阵,每个样本的维数下降了。
二、主分量分析的基本原理
假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵
()
当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。
定义:记x1,x2,…,x P为原变量指标,z1,z2,…,z m(m≤p)为新变量指标
()
系数lij的确定原则:
① z i与zj(i≠j;i,j=1,2,…,m)相互无关;
② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…; zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。

则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。
从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。
从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。
三、主分量分析的计算步骤
(一)计算相关系数矩阵

rij(i,j=1,2,…,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为
()
()
(二)计算特征值与特征向量
① 解特征方程    ,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ;
② 分别求出对应于特征值 的特征向量
  ,要求   =1,即     ,其中 表示向量 的第j个分量。
③ 计算主成分贡献率及累计贡献率
贡献率
累计贡献率
一般取累计贡献率达85%~95%的特征值
所对应的第1、第2、…、第m(m≤p)个主成分。
④ 计算主成分载荷
   

⑤主成分计算概括以下几点:
()
()
三、主分量分析主要作用
1.主成分分析能降低所研究的数据空间的维数。即用研究m维的Y空间代替p维的X空间(m<p),而低维的Y空间代替 高维的x空间所损失的信息很少。即:使只有一个主成分Y1(即 m=1)时,这个Y1仍是使用全部X变量(p个)得到的。例如要计算Y1的均值也得使用全部x的均值。在所选的前m个主成分中,如果某个Xi的系数全部近似于零的话,就可以把这个Xi删除,这也是一种删除多余变量的方法。 2.有时可通过因子负荷a'i'j的结论,弄清X变量间的某些关系。
3、多维数据的一种图形表示方法。我们知道当维数大于3时便不能画出几何图形,多元统计研究的问题大都多于3个变量。要把研究的问题用图形表示出来是不可能的。然而,

最近更新

小学历史与文化知识竞赛题库100道及参考答案(.. 37页

2025年西安职业技术学院单招综合素质考试题库.. 43页

2025年贵州盛华职业学院单招职业技能测试题库.. 44页

2025年郑州电力职业技术学院单招职业技能考试.. 44页

2025年重庆青年职业技术学院单招职业倾向性考.. 43页

2025年青川县幼儿园教师招教考试备考题库带答.. 31页

2026年主管中药师考试备考题100道及参考答案(.. 38页

2026年医学微生物学习题集附完整答案【历年真.. 41页

2026年主管中药师考试备考题100道【考点梳理】.. 38页

2026年安徽水利水电职业技术学院单招职业适应.. 44页

2026年宪法知识竞赛试题库100道附参考答案(突.. 40页

2026年广东南华工商职业学院单招综合素质考试.. 45页

2026年武汉民政职业学院单招职业倾向性考试模.. 45页

新安全生产法知识竞赛试题库带答案(完整版).. 44页

最新全国政法队伍教育整顿知识竞赛试题库及参.. 40页

最新全国政法队伍教育整顿知识竞赛试题库带答.. 40页

最新煤气操作证考试题100道及参考答案(最新).. 38页

最新煤气操作证考试题100道附答案(典型题) 39页

最新全国政法队伍教育整顿知识竞赛试题库及参.. 40页

最新全国政法队伍教育整顿知识竞赛试题库带答.. 40页

最新煤气操作证考试题100道及答案1套 39页

街道新冠肺炎疫情防控工作应急预案 7页

2025年制药设备机械项目发展计划 57页

2025年医疗建筑工程项目建议书 57页

2025年偏光片项目发展计划 56页

2025年减肥项目建议书 47页

2025年公寓式酒店项目发展计划 68页

2025年保温涂料项目建议书 65页

流数据上的快速离群点检测 7页

2026年江西交通职业技术学院单招职业倾向性考.. 37页