1 / 7
文档名称:

数据分析与挖掘重点整理.doc

格式:doc   大小:94KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据分析与挖掘重点整理.doc

上传人:sssmppp 2020/12/12 文件大小:94 KB

下载得到文件列表

数据分析与挖掘重点整理.doc

相关文档

文档介绍

文档介绍:数据分析与挖掘重点整理
名词解释5*
1、 逐步筛选策略:多元线性冋归,存在解释变量应以怎样的策略和顺序进入方 程及方程屮多个解释变量之间是否存在多重共线的问题。该策略在向前筛选 策略的基础上,结合向后筛选策略,在每个变量进入方程后再判断是否存在 可以剔除方程的变量。(该策略在引入变量的每一个阶段都提供了再剔除不 显著变量的机会,摒弃了向前筛选策略方法屮变量一旦进入回归方程就不会 被剔除的弊端。在一定程度上解决了变量之间存在的多重共线问题。)
2、 时间序列的季节变动:指一年或更短的时间之内,由于受某种固定周期性因 素(如自然、生产、消费等季节性因素)的影响而呈现出有规律的周期性波动。
3、 时间序列的循环变动:通常是指周期为一年以上,由非季节因素引起的涨落 起伏波形相似的波动。
4、 序列相关性(回归分析检验中的DW检验人一元及多元线性冋归模型假定 随机误差项是不相关的,如果一个回归模型的随机误差项之间相关,即相关 系数不为零,则称随机误差项之间存在着序列相关现象。这种札I关现象不是 指两个和两个以上的变量之间的关系血是指一个变量前后期数值Z间存在 的相关关系。
简答1(F (包括对输出结果的解释,代表什么意义)
1、 怎样判定样本数据是否适合进行因子分析
在进行因子分析之前,首先考察收集到的原有变量之间是否存在一定的线性关 系,是否适合采用因子分析提取因子。可以借助变量的相关系数矩阵和KMO检 验方法进行分析。如果大多数变量之间的相关系数都比较高,能够从屮提取公共 因子,则适合进行因子分析;根据KMO度量标准,KMO值越接近于1,变量 间的相关性越强,越适合进行因子分析;越接近于0,变量间的相关性越弱,越 不适合做因子分析。(例子:,说明变量间的相关 性比较强,比较适合做因子分析。)
2、 回归分析中,什么是多重共线性?有两个指标来反映多重共线性,这两个指 标如何反映多重共线性
多重共线性是指解释变量之间存在线性相关关系的现象,解释变量间高度的 多重共线性会给评价自变量的贡献率带来困难,因而要进行共线性诊断,并且确 定它们对参数估计的影响。采用容忍度(Tolerance)和方差膨胀因子(VTF)两 个统计量来检测多重共线性问题。
若容忍Jg(Tolerance)和方差膨胀因子(VIF)均为1,说明各解释变量之间不存 在多重共线性|问题。容忍度的取值范围在0〜1之间,越接近于0表示多重共线 性越强,越接近于1,表示多重共线性越弱;方差膨胀因子是容忍度的倒数,其 值大于等于1,其值越接近于1,解释变量间的多重共线性越弱,若其值远远大 于1,则共线性越强。
3、 异方差性中,观察一个表中哪个值取什么时异方差性显著,取什么时异方差 性不显著(应该是观察表的题)? ? ?理解下吧。。
残差的并方差检验
通过各解释变量与残差的Spearman等级相关分析,:
Spearman相关分析
Correlations
FAC1 1
FAC2 1
Stan dardized Residual
Spearman^ rho FAC1_1
Correlation Coefficier

-.333
-.077
Sig. (2-tailed)