1 / 12
文档名称:

主成分分析(共享).doc

格式:doc   大小:281KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析(共享).doc

上传人:ttteee8 2019/11/21 文件大小:281 KB

下载得到文件列表

主成分分析(共享).doc

相关文档

文档介绍

文档介绍::..主成分分析类型:一种处理高维数据的方法。降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。•、],x2,xp为某实际问题所涉及的P个随机变量。记X=(X],X2,-,Xp)T,其协方差矩阵为X=(臥“=E[(X-E(X))(X-E(X))T],它是一个P阶非负定矩阵。设Yx=l1xX=lnX^lnX^-^lipXp(1)Y2=llX=l2lXl+l22X2^-^l2pXpYp=l'X=lpiX^lp2X2+-^lppXp则有Var(Y.)=Var(l{X)=l:SZ.,i=l,2,・・・,p,Cov(Y:,Y)=Cov(I:X,1:X)=I;D匚,j=\,2,・・・,p・J J J第i个主成分:一般地,在约束条件Coviy^Y^=r^lk=0,A;=l,2,・・・,,求h使Var(Yj达到最大,由此h所确定的YTx称为X],x2,Xp的第i个主成分。=(Xl,X29...9Xp)T的协方差矩阵,E的特征值及相应的正交单位化特征向量分别为2,>22>•-・n坷no及则X的第i个主成分为(3)丫:=®X=GjiX]+ci2X2+…+©pXp,i=1,2,・・・,p,此时Var(Yi)=e1[^ei=2,.,i=l,2,・・・,p,Cov(Yi9Yk)=e^ek=09i・=(乙,丫2,・・・七)『为主成分向量,则Y=PTX,其中P=(ei,e2,...,ep),且Cov(Y)=Cov(PTX)=PT^P=h=Diag(A{,A2,...,Ap\由此得主成分的总方差为p p P2^(^)=2a=tr(PT^P)=traPPT)=/r(S)=£Var(Xz),1=1 1=1 1=1即主成分分析是把P个原始变量XT,X2,・・・,Xp的总方差£畑(尤)Z=1分解成p个互不相关变量Y],丫2,…,Yp的方差之和,即==£畑(乙)1=1而Var(Yk)=:务;;=1前m个主成分累计贡献率:它表明前m个主成分Y],—/=!丫„,综合提供X],X2,…,Xp中信息的能力。=PTX,故X=PY,从而Xj=勺必+e2jY2+・・・+epjYp,Cov(Yi9Xj)=£与务的相关系数为c_Coy(E,Xj)_入Sj_扬“=阴(Y冲=阿応=荷旬(4),不同的变量往往有不同的量纲,由于不同的量纲会引起各变量取值的分散程度差异较大,这时总体方差则主要受方差较大的变量的控制。为了消除由于量纲的不同可能带来的影响,常采用变量标准化的方法,即令X:(5)其中jUi=E(XJ,s=Var(XJ・这时的协方差矩阵便是的相关矩阵P=Sj)p“,其中Pij=E(X;X\=S(X,,Xj)利用X的相关矩阵P作主成分分析,有如下结论:设X、(X;,X;,・・・,X;r为标准化的随机向量,其协方差矩阵(即X的相关矩阵)为Q,则对的第i个主成分为并且£畑(*)=£葢=^Var(X;)=p, (8)1=1<=11=1其中2;>2;>...>2;>0为Q的特征值,£:=d,・・・,</为相应于特征值石的正交单位特征向量。第i个主成分的贡献率:莖;P前m个主成分的累计贡献率:呈二・样本主成分前面讨论的是总体主成分,但在实际问题中,一般s(或Q)是未知的,需要通过样本来估计。设为取自的一个容量为n的简单随机样本,则样本协方差矩阵及样本相关矩阵分别其中分别以S和R作为丫和。的估计,然后按总体主成分分析的方法作样本主成分分析。三♦例题某市为了全面分析机械类个企业的经济效益,选择了8个不同的利润指标,14企业关于这8个指标的统计数据如下表所示,试进行主成分分析。表1 14家企业的利润指标的统计数据变量企业序号净产值利润率(%)Xil固定资产利润率(%)Xi2总产值利润率(%)Xi2销售收入利润率(%)Xi3产品成本利润率(%)xi5物耗利润率(%)Xi6人均利润率七7(千元/人)流动资金利润率%)

最近更新

疫情前的开学准备方案 7页

小学语文一年级下册第9课《两只鸟蛋》优秀教案.. 10页

小学语文《王戎不取道旁李》知识点汇总 6页

2024安徽芜湖市港航(地方海事)管理服务中心.. 284页

2024年云南水利水电职业学院单招职业适应性测.. 54页

2024年保安员(初级)考试题库(a卷) 32页

2024年保安员必考题库及答案(考点梳理) 32页

2024年内蒙古乌兰察布盟行政职业能力测验题库.. 149页

2024年内蒙古北方职业技术学院单招职业适应性.. 55页

2024年内蒙古赤峰经济开发区发电限公司招聘14.. 600页

2024年北京社会管理职业学院单招职业适应性测.. 58页

2024年四川中医药高等专科学校单招职业适应性.. 52页

2024年四川长江职业学院单招职业适应性测试题.. 55页

2024年宁夏职业技术学院单招职业适应性测试题.. 55页

2024年山东化工职业学院单招职业适应性测试题.. 56页

2024年山西经贸职业学院单招职业适应性测试题.. 54页

2024年广州城建职业学院单招职业适应性测试题.. 58页

2024年江苏海事职业技术学院单招职业适应性测.. 54页

语音厅小游戏策划方案 3页

游戏推广员的周报 6页

田径国家一级裁判模拟试题 61页

四年级英语下册第四单元教案 17页

丙烯酰胺与nn一亚甲基双丙烯酰胺的凝胶反应 13页

ck520立式车床总体及床身设计 37页

先天性心脏病患儿护理查房 26页

2018年某市委第三巡察组副组长填表的说明及其.. 4页

太阳能电池交直流供电电源设计太阳能电池电源.. 91页