文档介绍:案例讨论四
案例讨论一
案例讨论三
案例讨论二
Contents Page
目录页
*
概念汇总
第一页,共21页。
Transition Page
过渡页
*
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
第二页,共21页。
概念
汇总
(average):
适用:对称分布或偏度不大的资料,尤其适合正态分布。
1、算术均数(mean):
2、加权均数:
3、几何均数:
(median):观察值按照从小到大排列时,居中心位置的数值。
适用于1、分布明显成偏态时,2、频数分布的一端或两端无确切数值时。不便于统计计算。
M:中位数;LM:M所在组的上限;f L:M所在组之前积累的频数;fM:M所在组的频数;i:组距。
(percentile):Px。在一组中找到这样一个数值P,全部观察值的x%小于P。P75、P25描述资料离散程度。
:一组观察值中,出现频率最高的那个观察值。若为分组资料,则为频率最高组的组中值。适用于大样本,但粗糙。
第三页,共21页。
概念
汇总
离散程度的统计描述
(range,R):即全距。粗略。适用于任何分布。
(quartile,Q):一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察值的数目占总例数的25%。去掉两端含有极端数值的25%,取中间的50%的观察值的数据范围即为~。
越大则数据变异越大。适用于偏态分布。
Q=P75 - P25
(variance):
样本方差 总体方差
(standard deviations):
适用于近似正态分布。
、可用于合并资料的直接计算
2、与均数结合可以完整概括一个正态分布。
第四页,共21页。
Transition Page
过渡页
*
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
第五页,共21页。
案例讨论一
案例讨论一 某年某课题组检测了某企业238名无工作也接触史工人的发***含量(μmol∕kg),整理结果见下表,适对该企业工人发功水平进行统计描述。
组段(μmol∕kg)
组中值X0
人数f
频率(%)
累计频数
累计频率(%)
~
20
20
~
66
86
~
60
146
~~
48
194
~
18
212
~
16
228
~
6
234
~
1
235
~
0
0
235
~
3
238
100
合计
—
238
100
—
—
为描述该企业工人发***含量的平均水平和变异程度,某研究者采用算术平均数和标准差两个统计指标。
按照频率表法计算算术均数为
=1699/238=(μmol∕kg)
标准差为
(μmol∕kg)
因此该研究着认为该企业工人发***的平均水平和变异程度为(﹢/﹣)μmol∕kg
你认为这样统计描述恰当么?为什么?
第六页,共21页。
案例讨论一
经案例分析可知该发***结果测定为偏态分布,因为均数(average)适用于对称分布或偏度不大的资料,尤其适合正态分布。标准差(standard deviations)同样适用于近似正态分布。所以不能选用均数与标准差来计算该企业法功的平均水平与变异程度。
因此通过统计描述类型的选择,中位数与四分位数间距更适合于描述变量值的平均水平与变异程度。
Q=P75 - P25
第七页,共21页。
案例讨论一
综上所述: