1 / 10
文档名称:

变量多重相关性对主成分分析的危害.doc

格式:doc   大小:192KB   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

变量多重相关性对主成分分析的危害.doc

上传人:2210620458 2021/12/22 文件大小:192 KB

下载得到文件列表

变量多重相关性对主成分分析的危害.doc

相关文档

文档介绍

文档介绍:1996年2月
第22卷第1期
北京航空航天大学学报
Journal of Beijing University of Aeronautics and Astronautics
Feb 1996
Vol. 22
变量多重相关性对主成分分析的危害“
王惠文
(北京航空航天大学许理学院)
摘要证实了主成分分析完全无法消除变董索统的多重相关性和重叠信息不
,在进行主成分分析之前,对变董系统的选择必须是枝其慎重的.
关键词 主戍分分析;变量;相关性;系统分析
分类号C
1变量多重相关性及其危害
在进行系统分析与评价过程中,为了更完备地描述系统,尽可能不遗漏一些举足轻重的系 统特性,分析人员往往倾向于尽可能周到地选取有关指标•这时在系统的指标体系中往往会出 现变量多重相关的现象•事实上,许多社会、经济、技术的指标都有着同步增长的趋势•当某个 分析人员无意或有意地对系统的某一特性,利用不同名目的相关指标反复描述时,便会人为地 夸大该特征在系统分析中的地位,影响分析的客观性,妨碍决策者的正确判断一
多重相关性的危害可以表现在许多方面•例如,在比较系统中各个样本点间的相似性和差 异时,可以采用欧氏距离作为基本测度:
d2{eit ek) = 丫(% - xkj)2
其中样本点© = ("心2…®)T€RP,即e..用p个变虽來描述.
现假设所要评估的系统只有两个主要性质Y), ,分析人员有意用9 个完全相关的变虽心,’,…,列来描述丫|,而对另一个性质Yu却仅用一个变量心。来表 示,则事实上有
10
d2(e(iet)=为(入-才勾尸=
厂】
9
- +(曲10 -心 10尸=9(曲1 - yti )2 +( 一 y“)2
显然,性质I南信息在计算中被重复了 9次,起到•了绝对重要的影响作用.
又如在人事评估中,以Yi表示年龄,以丫口表示业绩•若系统分析人员用一系列变址描 述性质Y [,如:年龄、工龄、岗位丄龄、丄龄丄资……(在我国目前的许多企事业单位,这些变 量确系是极其相关的),另一方面,若对业绩因素只用一个变量表示,则可以看到由于变量的多 重相关性,会大大强调年龄因索在评估中的作用,从而忽略了业绩因索.
如何消除变量多重相关性,还有待于统计学家们的大量工作,以利于得到一个更加客观的
收稿日期:1994-10-13作者女38岁別教授100083北京
I)国求1'1然科学斥金钱助须II
1996年2月
第22卷第1期
北京航空航天大学学报
Journal of Beijing University of Aeronautics and Astronautics
Feb 1996
Vol. 22
© 1994-2012 China Academic Journal Electronic Publishing House. All rights reserved. http:/7www.
67 北原航空肌大大字字报 第22卷
变供系统,尽可能减少重叠信息的不良作用.
2主成分分析不能消除变量多重相关性的作用
近年来,随着主