文档介绍:第二章统计资料的整理
第二章统计资料的整理
调查收集到的统计资料常常是大量的。按照一般情形,如有上百个原始
的数字和事项,人们就很难比较并发现它们的相互关系或规律。所以统计资
料必须经过整理。统计资料的整理是统计方法中的关键环节,是以后进行统
计分析的基础。
统计表
调查得到的原始统计资料必需加工整理,如分类归并汇总,按时间前后
或按数值大小重新排列等等,才容易发现数据的规律性并便于做进一步的统
计分析。表 2-1 为原始的统计资料。
表 2-1 某校 200 个学生高等数学考试成绩
98 54 79 73 99 78 55 65 65 72
52 65 96 72 70 84 77 62 63 88
83 60 78 88 76 67 94 86 85 72
65 73 80 72 100 60 58 63 76 63
76 66 83 63 60 69 68 56 85 87
84 62 75 87 86 70 82 85 65 72
69 81 100 72 71 85 70 75 72 55
92 65 56 55 60 45 75 65 76 70
65 82 85 70 62 75 70 62 75 57
72 82 65 57 71 80 88 91 81 60
64 75 78 60 58 76 60 65 72 78
65 53 62 85 75 71 65 84 76 80
75 60 61 86 86 78 81 76 62 83
72 73 67 61 85 91 86 92 86 75
75 86 65 86 65 94 86 65 91 100
85 70 61 94 86 85 90 86 82 56
76 73 85 65 88 74 76 95 73 85
85 61 52 78 85 86 71 95 85 65
61 62 85 65 85 96 75 64 62 78
65 85 75 76 62 86 96 65 98 62
- 15 -
第二章统计资料的整理
序列表将变量所取值按时间顺序或按地域排列的表,并分别称为时间
序列表和地域序列表。见表 2-2。
表 2-2 我均工资指数(以 1952 年为 100)
指数指数
年份年份
货币工资实际工资货币工资实际工资
1978 100 100 1995
1980 130 1996
1985 1997
1990 415 1998
1991 1999
1992 2000
1993
1994
分类表可以按性质分类(常称为定性分布),也可以按数值分类(常
称为频数分布)。
定性分布先建立一个关于元素的类别系统,各类要互相排斥,而且是
完备的,使被观测的各元素能既不重复又无遗漏地分到各类中去。记录分到
同类中的元素个数,或将同类中各元素对所研究的变量的观测值加以归并,
这样得到定性分布。见表 2-3。
表 2-3 全国高等学校情况(2000)
类别学校数学校百分比在校学生数学生百分比
综合大学 83 1108166
理工院校 293 1786372
师范院校 221 266778
医药院校 100 312440
农林院校 50 316778
财经院校 68 337099
其他院校 77 258270
总计 892 4385903
频数分布按变量所取的值进行分类,分类的原则与定性分布相同,于
是资料中每个观测值都分到相应类中去。记录各类中观测值出现的次数,制
成表格形式,就是频数分布表。
- 16 -
第二章统计资料的整理
在作频数分布表时,如果变量所能取值的数目很小,就按取值大小顺序
排列,每个值为一类。如果变量所能取值的数目很大,特别当变量是连续的
情形,就将变量所取的值分组,记录观测值落在各组中的资料(称为频数),
作为表格形式,常称为频数分