文档介绍:第3章数据的描述
统计图与统计表
数据集中趋势的数值描述
数据离散程度的数值描述
数据分布的形态
中央财经大学统计学院
本章要回答的问题
常用的统计图表有哪些?如何绘制和解释其含义?
通常使用哪些数值指标描述数据的特征?如何计算?
2
中央财经大学统计学院2010 2
§ 统计图与统计表
绘制统计图一般都需要先对数据进行统计分组,在得到的频数分布表的基础上制图。
3
中央财经大学统计学院2010 3
§zhi 统计分组与频数分布
统计分组:就是按照研究目的将数据分成若干组的统计方法。
关键:选择分组变量和划分各组界限
例如按照考试成绩把学生分为优、良、中、及格、不及格。
统计分组的结果是形成频数分布(分布数列,Frequency Distribution)。
4
中央财经大学统计学院2010 4
频数分布举例
两个构成要素:
各组的分组界限
每组中的次数或频率
通过频数分布表可以发现数据分布的特征。
频数(frequency) :每个组中的数据个数,也称次数。
频率(relative frequency) :频数/总数据个数。
成绩
人数
频率
60以下
3
%
60-70
8
%
70-80
12
%
80-90
15
%
90以上
4
%
合计
42
%
5
中央财经大学统计学院2010 5
分组方法
等距分组
不等距分组
单变量值分组
组距分组
分组方法
按品质变量分组
按数量变量分组
6
中央财经大学统计学院2010 6
单变量值分组
将一个变量值作为一组,适合于离散变量,适合于变量值较少的情况。
例如某学院2008年毕业研究生毕业时发表论文篇数的频数分布表(右表)。
发表论文篇数
人数
2
3
4
5
6
6
8
5
3
2
合计
24
7
中央财经大学统计学院2010 7
组距分组
将变量值的一个区间作为一组,适合于连续变量,适合于变量值较多的情况。
分组必须遵循“不重不漏”的原则。
分为等距与不等距分组。
各组组距都相等时为等距分组。
为了避免有些组中的频数很少甚至是空白的情况,有时也可以采用不等距(异距)分组。
应用中可能需要把第一组和/或最后一组设为开口组。
8
中央财经大学统计学院2010 8
组距分组的步骤
1、确定组数:通常为5到15 (20)组。
Sturges 提出的经验公式:分组组数K应满足
2、确定组距和各组界限,建议为5,10…的倍数。
组距≈( 最大值- 最小值)÷ 组数
3、根据分组整理成频数分布表
9
中央财经大学统计学院2010 9
组距分组中的基本概念
1、下限:一个组的最小可能值
2、上限:一个组的最大可能值
3、组距:上限与下限之差
4、组中值:下限与上限之间的中点值,(下限+上限)/2。
开口组的组中值可以按以下方法计算:
缺下限:上限-邻组组距/2
缺上限:下限+邻组组距/2
但许多作者认为无法计算开口组的上限或下限。
10
中央财经大学统计学院2010 10