1 / 6
文档名称:

主成分分析、聚类分析、因子分析的基本思想及优缺点.doc

格式:doc   大小:38KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析、聚类分析、因子分析的基本思想及优缺点.doc

上传人:pppccc8 2019/11/1 文件大小:38 KB

下载得到文件列表

主成分分析、聚类分析、因子分析的基本思想及优缺点.doc

文档介绍

文档介绍::..主成分分析:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标來解释多变量的方差・协方差结构,即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的综合指标即为主成分。求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知)。(实际研究中,总休协方差阵与相关阵是未知的,必须通过样本数据來佔计)注意事项:1•由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;,可直接求协方差阵;对于度虽单位不同的指标或是取值范I韦I彼此差异非常人的指标,应考虑将数据标准化,再由协方差阵求主成分;;(最小特征根接近于零,说明存在多重共线性问题)。优点:首先它利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集屮了原始变量的人部分信息。其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价。再次它在应用上侧垂于信息贡献影响力综合评价。缺点:当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。命名清晰性低。聚类分析:将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元索的相似性更强。目的在于使类间元素的同质性最人化和类与类间元素的界质性最大化。。其主要依据是聚到同一个数据集中的样木应该彼此相似,而属于不同组的样本应该足够不相似。常用聚类方法:系统聚类法,K-均值法,模糊聚类法,有序样品的聚类,分解法,加入法。注意事项:,K■均值法只能对记录进行分类;・均值法要求分析人员爭先知道样品分为多少类;,方差齐性等要求较高。应川领域:细分市场,消费行为划分,设计抽样方案等优点:聚类分析模型的优点就是直观,结论形式简明。缺点:在样本量较大吋,要获得聚类结论有一定困难。由丁•相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中冇时尽竹从被试反映所得出的数据中发现他们Z间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或札I似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。因子分析:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具冇错综复杂关系的变蜃归结为少数几个综合因了。(因了分析是丄成分的推广,相对于上成分分析,更倾向于描述原始变量之间的相关关系),就是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因了变量,以及如何使因了变量具冇较强的可解释性的一种多元统计分析方法。求解因/载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。注意事项:,特姝因子之间不相关,公共因子和特殊因子Z间不相关。应川领域:解决共线性问题,评价问卷的结构效度