文档介绍:.
1.( 10 分)数据中心化和标准化在回归分析中的意义是什么?
在多元线性回归分析中 ,因为涉及多个自变量 ,自变量的单位往往不同 ,会给分析带来一
定的困难 ,又由于涉及的数据量很大 ,就可能会以舍入误差而使得计算结果不理想 .
,减少了计算的工作量 ,对手工计算尤为重要 .
,避免不必要的误差 .
2.( 10 分)在实际问题中运用多元线性回归应注意哪些问题?
在实际问题中 ,人们用复相关系数 R 来表示回归方程对原有数据拟合程度的好坏 ,但是拟
合优度并不是检验模型优劣的唯一标准 ,有时为了使模型从结构上有较合理的经济解释 ,R2
等于 左右也给回归模型以肯定的态度 .
在多元线性回归分析中 ,我们并不看重简单相关系数 ,而认为偏相关系数才是真正反映因
变量 y 与自变量 xi 以及自变量 xi 与 x j 的相关性的数量 .
用相关系数 R2 大小来衡量模型的拟合优度 ,不能仅由 R2 值很大来推断模型优劣 .
在实际应用回归方程进行控制和预测时 ,给定的 x0 值不能偏离样本均值太大 ,如果太大 ,
用回归方程无论是作因素分析还是经济预测 ,效果都不会理想 .
得到实际问题的经验回归方程后 ,还不能马上用它去作分析和预测 ,还需运用统计方法对
回归方程进行检验 .
3.( 15 分)主成分分析与因子分析的主要方法和思想是什么?两者有何联系与区别?
求解主成分的方法:从协方差阵出发(协方差阵已知) ,从相关阵出发(相关阵 R 已知),
采用的方法只有主成分法。
一、主成分分析的基本思想
在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规
律,人们往往要考虑与其有关系的多个指标, 这些指标在多元统计中也称为变量。 这样就产
可编辑
.
生了如下问题: 一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,
而另一方面随
着考虑指标的增多增加了问题的复杂性,
同时由于各指标均是对同一事物的反映,
不可避免
地造成信息的大量重叠, 这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律。
基于
上述问题, 人们就希望在定量研究中涉及的变量较少,
而得到的信息量又较多。
主成分分析
正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信息的一种多元
统计方法。
既然研究某一问题涉及的众多变量之间有一定的相关性,
就必然存在着起支配作用的共同因
素,根据这一点, 通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,
利用原始变
量的线性组合形成几个综合指标(主成分)
,在保留原始变量主要信息的前提下起到降维与
简化问题的作用, 使得在研究复杂问题时更容易抓住主要矛盾。
一般地