1 / 6
文档名称:

主成分分析、聚类分析、因子分析基本思想及优缺点.doc

格式:doc   大小:45KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析、聚类分析、因子分析基本思想及优缺点.doc

上传人:芙蓉小镇 2021/11/29 文件大小:45 KB

下载得到文件列表

主成分分析、聚类分析、因子分析基本思想及优缺点.doc

文档介绍

文档介绍:.
主成分分析: 利用降维(线性变换 )的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分 ),用综合指标来解释多变量的方差 - 协方差结构,即每个主成分都是原始变量的线性组合 ,且各个主成分之间互不相关 ,使得主成分比原始变量具有某些更优越的性
能(主成分必须保留原始变量 90%以上的信息),从而达到简化系统结构,抓住问题实质的目的综合指标即为主成分。
求解主成分的方法: 从协方差阵出发(协方差阵已知),从相关阵出发(相关阵 R 已知)。
(实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)
注意事项: 1. 由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;
对于度量单位或是取值范围在同量级的数据,可直接求协方差阵;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;

在选取初始变量进入分析时应该特别注意原始变量是否存在多重共线性的问题(最小特征根接近于零,说明存在多重共线性问题)。
优点:首先它利用降维技术用少数几个综合变量来代替原始多个变量, 这些综合变量集中了
原始变量的大部分信息。 其次它通过计算综合主成分函数得分, 对客观经济现象进行科学评
价。再次它在应用上侧重于信息贡献影响力综合评价。
缺点:当主成分的因子负荷的符号有正有负时, 综合评价函数意义就不明确。 命名清晰性低。
聚类分析: 将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一
类中的元素之间的相似性比其他类的元素的相似性更强。 目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。
。其主要依据是聚到同一个数据集中的样本应该彼此相似, 而属于不同组的样本应该足够不相似。
精品
.
常用聚类方法: 系统聚类法, K- 均值法,模糊聚类法,有序样品的聚类,分解法,加入法。
注意事项: 1. 系统聚类法可对变量或者记录进行分类, K- 均值法只能对记录进行分类;
K- 均值法要求分析人员事先知道样品分为多少类;
对变量的多元正态性,方差齐性等要求较高。
应用领域: 细分市场,消费行为划分,设计抽样方案等
优点: 聚类分析模型的优点就是直观,结论形式简明。
缺点: 在样本量较大时, 要获得聚类结论有一定困难。 由于相似系数是根据被试的反映来建立反映被试间内在联系的指标, 而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系, 但事物之间却无任何内在联系, 此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。
因子分析: 利用降维的思想, 由研究原始变量相关矩阵内部的依赖关系出发, 把一些具有错
综复杂关系的变量归结为少数几个综合因子。 (因子分析是主成分的推广, 相对于主成分分