1 / 23
文档名称:

主成分分析(修改后).doc

格式:doc   大小:443KB   页数:23页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析(修改后).doc

上传人:pppccc8 2019/2/24 文件大小:443 KB

下载得到文件列表

主成分分析(修改后).doc

文档介绍

文档介绍::..。对于问题一比较样本协方差矩阵和样本相关矩阵主成分分析的结果差异。首先,本文采用降维的思想,运用主成分分析法减少变量的个数,借助Matlab软件建立有关7项指标的协方差矩阵和样木相关矩阵,得出其特征值和特征向量;其次,分别计算各自主成分的贡献率,对于样本协方差矩阵,%,%%,对于样本相关矩阵,根裾主成分个数提取原则,提取特征值大于1的成分,从而确定三种主成分,%,%%;从而发现样本相关矩阵的求解结果更符合实际。对于问题二选择三个或者更少的主成分反映原始数据的变化及原因。%,%;从而得出结论:样本相关矩阵的结论更符合实际,确定空气污染程度需根据原始数据综合前三个样本成分。考虑到各主成分之间存在的相互依赖关系,将模型进行推广,进一步运用回归分析法预测和控制空气污染的主要成分,得到的结果将更加贴近实际情况。关键词主成分分析;降维思想;空气污染符号xYCov(Uj)PAi一、问题重述己知某城市在42天中中午12点的7项空气污染数据:风速、太阳辐射、CO、NO、NO2、O3、HC,完成以下问题:问题一:分别利用样本协方差矩阵和样本相关矩阵作主成分分析,比较二者结果差异;问题二:选择三个或者更少的主成分反映原始数据的变化并作出解释。二、问题分析空气污染是现下较为严重且广受关注的热点问题,研究污染空气的主要因素及特点有助于控制空气污染源,为改善环境提供必要依据。由于题目所给数据较多,需要对其进行处理分析,因此本文将采取主成分分析法([1])分析影响空气污染的主要因素。对于问题一:首先,利用Matlab求出样本协方差矩阵和样本相关矩阵;其次,分别计算这两个矩阵的特征值与特征向量,及相应的主成分贡献率与累计贡献率;比较结果分析其差异;对与问题二:根据累计贡献率的大小,选择前几个主成分代替原来的7个变量,使得信息损失最小,并对比所选取的主成分与原始数据对比做出合理解释。三、,具有统计价值;。、符号说明符号含义样木方差原始变量样本主成分样本协方差样本相关矩阵样木平均值Z 协方差矩阵P 特征向量矩阵A 矩阵的特征值e 矩阵的特征向量五、模型建立与求解问题中的变量太多不但会增加计算的复杂性,而II也给合理的分析问题和解决问题带来很大的困难:同时,这些变量之间存在一定的相关性,也使得这些变量所反映的信息在一定程度上有所重叠。为了减少变量的个数,同吋提高问题研宄的合理性,本文采用了降维的思想,利用主成分分析法来减少变量的个数,同时不会使数据反映的信息量有大的损失。%=0:1,12,%3,一,^广的协方差矩阵,2:的特征值与正交化特征向量分别为42乂2 2…2/1,,20及A,e2,e3,…,,.•个主成分为(=enxl+ei2x2+ei3x3+••-eipxp,(/=1,2,3,•••,/?) (1)根据已有数据计算得样本xzCrpXyXy,')7的均值向量;i=(足,叉2,又3,...,\)7为%=(-1n/=1(2)利用Matlab软件代入数据可求得随机变量x= 相应的样本协方差矩阵为(只写下三角)------- |/l£-Z|=0代入数据可求得Z的特征值為与对疲单位正交化特征向量啡=1,2,…,7)分别为A,=,=(---)丁A2=,e2=(----)T=,=(---