1 / 22
文档名称:

大数据分析报告与可视化.pdf

格式:pdf   大小:665KB   页数:22页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据分析报告与可视化.pdf

上传人:3345778 2022/3/16 文件大小:665 KB

下载得到文件列表

大数据分析报告与可视化.pdf

文档介绍

文档介绍:: .

数据分析统计工具 : SPSS、 minitab 、 JMP。
常用数据分析方法 :
1、聚类分析( Cluster Analysis )
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。
聚类是将数据分类到不同的类或者簇这样的一个过程, 所以同一个簇中的对象有很大的相似
性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,
人们不必事先给出一个分类的标准, 聚类分析能够从样本数据出发, 自动进行分类。 聚类分
析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,
所得到的聚类数未必一致。
2、因子分析( Factor Analysis )
因子分析是指研究从变量群中提取共性因子的统计技术。 因子分析就是从大量的数据中
寻找内在的联系,减少决策的困难。
因子分析的方法约有 10 多种,如重心法、影像分析法,最大似然解、最小平方法、阿
尔发抽因法、 拉奥典型抽因法等等。 这些方法本质上大都属近似方法, 是以相关系数矩阵为
基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□ 2 估值。在社会学研
究中,因子分析常采用以主成分分析为基础的反覆法。
3、相关分析( Correlation Analysis )
相关分析 ( correlation analysis ),相关分析是研究现象之间是否存在某种依存关系,
并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关
系,例如,以 X 和 Y 分别记一个人的身高和体重, 或分别记每公顷施肥量与每公顷小麦产量,
— 2精选文档
则 X 与 Y 显然有关系, 而又没有确切到可由其中的一个去精确地决定另一个的程度, 这就是
相关关系。
4、对应分析( Correspondence Analysis )
对应分析 (Correspondence analysis) 也称关联分析、 R-Q 型因子分析,通过分析由定
性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,
以及不同变量各个类别之间的对应关系。 对应分析的基本思想是将一个联列表的行和列中各
元素的比例结构以点的形式在较低维的空间中表示出来。
5、回归分析
研究一个随机变量 Y 对另一个 (X) 或一组 (X1, X2,⋯, Xk) 变量的相依关系的统计分析
方法。回归分析( regression analysis) 是确定两种或两种以上变数间相互依赖的定量关系
的一种统计分析方法。 运用十分广泛, 回归分析按照涉及的自变量的多少, 可分为一元回归
分析和多元回归分析; 按照自变量和因变量之间的关系类型, 可分为线性回归分析和非线性
回归分析。
6、方差分析 (ANOVA/Analysis of Variance)
又称“变异数分析”或“ F 检验”,是 发明的,用于两个及两