文档介绍:第5章数据分布特征的描述
【学习目标】
本章主要介绍了数据分布特征的描述的基本理论,包括平均指标和变异指标的基本概念、种类以及各种计算方法,计算和应用平均指标应注意的问题等。通过学习,使学习者能够掌握数据分布的集中趋势和离散特征,为经济管理服务。
【学习要求】
通过本章的学均指标和变异指标的基本概念,熟练掌握各种计算方法,明确计算和运用平均指标应注意的问题等等。
【学习内容】
统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标准差;三是分布的偏态和峰度,反映数据分布的形状。这三个方面分别反映了数据分布特征的不同侧面,第一、二方面是主要的。本章重点讨论第一、第二两方面代表值的计算方法、特点及其应用场合。
集中趋势——数值平均数
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方法通常有两种:一是从总体各单位变量值中抽象出具有一般水平的量,这个量不是各个单位的具体变量值,但又要反映总体各单位的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将总体各单位的变量值按一定顺序排列,然后取某一位置的变量值来反映总体各单位的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数、四分位数等形式。
算术平均数,是集中趋势测度中最重要的一种,它是所有平均数中应用最广泛的平均数。因为它的计算方法是与许多社会经济现象中个别现象与总体现象之间存在的客观数量关系相符合的。
例如,企业职工的工资总额就是各个职工工资额的总和,职工的平均工资必等于职工的工资总额与职工总人数之比。所以,算术平均数的基本公式应该是:
算术平均数=
算术平均数一般就称为平均数(mean)。其定义是:观察值的总和除以观察值个数的商。在已知研究对象的总体标志总量及总体单位总量时,可直接利用上式计算。例如,某企业某月的工资总额为680000元,职工总数为1000人,则:
该企业职工月平均工资==680(元)
利用上式计算时,要求各变量值必须是同质的,分子与分母必须属于同一总体,即公式的分子是分母具有的标志值,分母是分子的承担者。在实际工作中,就手工计算而言,由于所掌握的统计资料的不同,利用上述公式进行计算时,可分为简单算术平均数和加权算术平均数两种。
1. 简单算术平均数(Simple Arithmetic Mean)
根据未经分组整理的原始数据计算的均值。设一组数据为x1,x1,…xn,则简单算术平均数的计算公式如下:
(5–1)
例5–1 据南方人才服务中心调查,从事IT行业的从业人员年薪在40000-55000元之间,表5–1的数据是IT从业人员年薪的一个样本:
表5–1 24名IT从业人员年薪资料表
49100
48600
49950
48800
47200
49900
51350
54600
49300
48700
51200
50300
51000
49000
49400
49800
51400
48900
51800
48650
49600
51300
53400
51900
计算IT从业人员的平均年薪。
根据公式计算如下:
2. 加权算术平均数(Weighted Arithmetic Mean)
根据分组整理的数据计算的算术平均数。其计算公式为:
(5–2)
式中:f代表各组变量值出现的频数。
例5–2 以表5–2为例,计算人均日产量。计算表见表5–2。
解:
表5–2 某企业50名工人加工零件均值计算表
按零件数分组
组中值x
频数f
xf
105~110
110~115
115~120
120~125
125~130
130~135
135~140
3
5
8
14
10
6
4
合计
––
50
平均日产量=
这种根据已分组整理的数据计算的算术平均数就称为加权算术平均数。这时,算术平均数的大小,不仅取决于研究对象的变量值,而且受各变量值重复出现的频数(f)或频率(f/∑f)大小的影响,如果某一组的频数或频率较大,说明该组的数据较多,那么该组数据的大小对算术平