1 / 12
文档名称:

第4章 数据分布特征的测度.doc

格式:doc   页数:12
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第4章 数据分布特征的测度.doc

上传人:中国课件站 2011/12/13 文件大小:0 KB

下载得到文件列表

第4章 数据分布特征的测度.doc

文档介绍

文档介绍:第四章数据分布特征的测度
§1概述
数据分布特征
集中趋势
离散趋势
分布形状
均值
位置平均数
众数
全距
四分位差
方差和标准差
变异系数
偏斜度
峰度
§2 集中趋势的测度
一、集中趋势的含义
(一)集中趋势的概念
集中趋势(Central tendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
(二)集中趋势的内容
(Mean)
算术平均数
调和平均数
几何平均数
切尾均值

中位数
四分位数
十分位数
百分位数

二、众数

众数(Mode)是一组数据中出现次数最多的变量值,用表示。主要用于测度定类型数据的集中趋势。

例:为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题作了邮寄问卷调查,其中的一个问题是:“您比较关心下列哪一类广告?”
①商品广告;②服务广告;③金融广告;④房地产广告;⑤招生招聘广告;⑥其他广告。
表4-1 某城市居民关注广告类型的频数分布
广告类型
人数
商品广告
112
服务广告
51
金融广告
9
房地产广告
16
招生招聘广告
10
其他广告
2
合计
200
商品广告

①确定众数组——频数最多的组
②计算众数值
L
U
d
x
y
X
f
图4-1 众数值计算示意图
可见,众数实际上是频数最大组的下限加上按一定几何比例分配组距所得到的那段组距,即
因为

所以(下限公式)
同理,可得上限公式:

例:某地区3000家农户的年收入情况资料如下:
年收入额(元)
农户数(户)
向上累计户数(户)
向下累计户数(户)
5000—6000
240
240
3000
6000—7000
480
720
2760
7000—8000
1050
1770
2280
8000—9000
600
2370
1230
9000—10000
270
2640
630
10000—11000
210
2850
360
11000—12000
120
2970
150
12000—13000
30
3000
30
合计
3000
——
——
解:;
所以(元)
三、位置平均数

中位数(Median)是一组数据按从小到大排序后,处于中间位置上的变量值,用表示。中位数是一个位置代表值,它主要用于测度定序数据的集中趋势。

①按标志值大小进行排列得;
②计算中间位置;
③计算中位数具体数值。
标志值个数为奇数时
标志值个数为偶数时


①单项分组资料
ⅰ计算中位数位置;
ⅱ将分组数列的次数进行向上或向下累计;
ⅲ选择第一个大于或等于的组即为中位数所在组;
ⅳ对应的标志值为中位数。
②组距分组资料
ⅰ、ⅱ、ⅲ同单项分组资料;
ⅳ计算中位数值:
L
U
d
图4-2 中位数值计算示意图
设标志值次数在一组内为均匀分布的,运用插值法,得

整理得下限公式:

上限公式:

例:某地区3000家农户的年收入情况资料如下:
年收入额(元)
农户数(户)
向上累计户数(户)
向下累计户数(户)
5000—6000
240
240
3000
6000—7000
480
720
2760
7000—8000
1050
1770
2280
8000—9000
600
2370
1230
9000—10000
270
2640
630
10000—11000
210
2850
360
11000—12000
120
2970
150
12000—13000
30
3000
30
合计
3000
——
——
(元)

四分位数(Quartile)也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含25%的数据,处在分位点上的数值就是四分位数。
①下四分位数
②中位数
③上四分位数

①十分位数(Decile)是通过九个点将全部数据等分为十部分,其中每部分包含10%的数据,处在分位点上的数值就是十分位数。
②百分位数(Percentile)是通过99个点将全部数据等分为100部分,其中每部分包含1%的数据,处在分位点上的数值就是百分位数。
四、均值

算术平均数(