文档介绍:第二章平均水平(集中趋势)的统计描述
数值变量的统计描述——之一
概要
第一节频数分布(distribution of frequency)
频数表(frequency table)
直方图(histogram)
第二节平均数(average)
算数均数(arithmetic mean)
几何均数(geometric mean)
中位数(median)和百分位数(percentile)
2
统计分析
统计描述
统计推断
计量资料
计数资料
区间估计
假设检验
集中趋势
离散趋势
3
一、频数分布表(frequency distribution table)
常用来反映各变量取值及其相应频数之间的关系。
研究资料的频数分布类型是选择合适的统计指标进行统计描述的基础。
第一节频数分布
4
(1)求极差(range):即最大值与最小值之差,又称为全距。
本例极差: R=-=(次/分)
(2)决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分8-15个组,为方便计,组距参考极差的十分之一, 再略加调整。
本例i= R /10==≈。
(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。
(4)列表划记:用划记法将所有数据归纳到各组段,得到各组段的频数。
7
表2-2 某地140名正常男子红细胞数的频数表
组段(1)
划记
(2)
频数
(3)
相对频数(%)
(4)=(3)/N
累积频数
(5)=(3)↓
累积相对频数(%)(6)=(5)/N
~
丅
2
2
~
正一
6
8
~
正正一
11
19
~
正正正正正
25
44
~
正正正正正正丅
32
76
~
正正正正正丅
27
103
~
正正正丅
17
120
~
正正下
13
133
~
4
137
~
丅
2
139
~
一
1
140
合计
140
8
①集中趋势(central tendency):变量值集中位置。本例在组段“~”。
——平均水平指标
②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标
9
二、直方图
10