1 / 6
文档名称:

主成分分析聚类分析因子分析基本思想及优缺点.doc

格式:doc   大小:44KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析聚类分析因子分析基本思想及优缺点.doc

上传人:春天资料屋 2022/4/15 文件大小:44 KB

下载得到文件列表

主成分分析聚类分析因子分析基本思想及优缺点.doc

文档介绍

文档介绍:.
主成分分析:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标来解释多变量的方差-协方差结构,即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始问题);
(不符合时,可使用Logistic回归替代),且各组解释
变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。
相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。
应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。
对应分析/最优尺度分析:利用降维的思想以达到简化数据结构的目的,同时对数据表中的行与列进行处理,寻求以低维图形表示数据表中行与列之间的关系。
对应分析:用于展示变量(两个/多个分类)间的关系(变量的分类数较多时较佳);
最优尺度分析:可同时分析多个变量间的关系,变量的类型可以是无序多分类,有序多分类或连续性变量,并对多选题的分析提供了支持。
典型相关分析:借用主成分分析降维的思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关。
相同点:
(因子)来综合反映原始变量(因子)的
主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85%以上,所以即
使用少数的几个新变量,可信度也很高,也可以有效地解释问题。并且新的变量彼此间互不
相关,消除了多重共线性。
精品
.
,并不是原始变量筛选后剩余的变量。在主成分分析中,最终
确定的新变量是原始变量的线性组合,如原始变量为x1,x2,...,x3,经过坐标变换,
将原有的p个相关变量xi作线性变换,每个主成分都是由原有p个变量线性组合得到。在
诸多主成分Zi中,Z1在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。
因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对
原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。公共
因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子。
,就可以将主成分得分或因子得分代替原始
变量进行进一步的分析,因为主成分变量及因子变量比原始变量少了许多,所以起到了降维
的作用,为我们处理数据降低了难度。
,并合理地分成若干类,因此它是一种根
据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在
组合关系。它是通过一个大的对称矩阵来探索相关关系的一种数学分析方法,是