文档介绍:SPSS多元线性回归分析
D
                           图1-3缺失值分析
能源数据缺失值分析结果如表1-1所示:
                                                               单变量统计
 
N
均值
标准差
缺失
极值数目a
计数
百分比
低
高
能源消费总量
30
0
.0
0
1
煤炭消费量
30
0
.0
0
2
焦炭消费量
30
0
.0
0
2
原油消费量
28
2
0
1
汽油消费量
30
0
.0
0
1
煤油消费量
28
2
0
4
柴油消费量
30
0
.0
0
2
燃料油消费量
30
0
.0
0
3
天然气消费量
30
0
.0
0
2
电力消费量
30
0
.0
0
3
原煤产量
26
4
0
2
焦炭产量
29
1
0
2
原油产量
18
12
0
0
燃料油产量
25
5
0
3
汽油产量
26
4
0
2
煤油产量
20
10
0
0
柴油产量
26
4
0
1
天然气产量
20
10
0
3
电力产量
30
0
.0
0
0 
表2-1 能源消耗量与产量数据缺失值分析
                                              表1-1 能源消耗量与产量数据缺失值分析
SPSS提供了填充缺失值的工具,点击菜单栏“ ”-->“ ”,即可以使用软件提供的几种填充缺失值工具,包括序列均值,临近点中值,临近点中位数等。结合本次实习数据的具体情况,我们不使用SPSS软件提供的替换缺失值工具,主要是手动将缺失值用零值来代替。
 
 描述性数据汇总
描述性数据汇总技术用来获得数据的典型性质,我们关心数据的中心趋势和离中趋势,根据这些统计值,可以初步得到数据的噪声和离群点。中心趋势的量度值包括:均值(mean),中位数(median),众数(mode)等。离中趋势量度包括四分位数(quartiles),方差(variance)等。
SPSS提供了详尽的数据描述工具,单击菜单栏的“ ”-->“ ”-->“ ”,将弹出如图2-4所示的对话框,我们将所有变量都选取到,然后在选项中勾选上所希望描述的数据特征,包括均值,标准差,方差,最大最小值等。由于本次数据的单位不尽相同,我们需要将数据标准化,同时勾选上“将标准化得分另存为变量”。
 
图1-4 描述性数据汇总
得到如表1-2所示的描述性数据汇总。
 
N
极小值
极大值
均值
标准差
方差
能源消费总量
30
911
26164
煤炭消费量
30
332
29001
焦炭消费量
30
19
5461
原油消费量
30
0
5555
汽油消费量
30
18
771
煤油消费量
30
0
262
柴油消费量
30
27
1368
燃料油消费量
30
0
1574
14