文档介绍:第 10章非参数统计
非参数统计
亦称非参数检验,是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。
非参数检验与参数检验的比较
检验类别
假定条件
目的
适用范围
优点
缺点
参数检验
总体呈正态分布
参数估计
假设检验
定距资料
定比资料
充分利用信息
使用范围
有限
非参数检验
无限制
假设检验
定性、定序、定距、
定比资料
方法直观,运算简单
信息少,检验功效低
χ2检验
含义
运用χ2分布作为理论工具,在非参数统计中可用于对总体的分布或随机变量的独立性进行的检验。
χ2检验的原理
在实践中,经常要对一些观察值的实际频数与某种理论频数进行比较,以判断实际结果与理论是否一致。
设有k个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计量
数理统计证明
在大量试验中,若f0与fe相一致时,χ2服从χ2分布。
(f0-fe)比较小时,χ2值也较小;(f0-fe)比较大时,χ2也较大。当χ2值大到按χ2分布超过设定的临界值时,即为小概率事件,就可以认为实际结果与理论假设不一致。
χ2检验的应用
拟合优度检验:
独立性检验:
利用随机样本资料对总体是否服从某种
理论分布的检验。
利用样本资料对总体的两个变量的数据是
否彼此关联的检验,如果不关联即为独立。
1、拟合优度检验
(1)对总体分布建立假设
H0:总体服从某种理论分布
H1:总体不服从该理论分布
(2)抽样并对样本资料编成频数分布(f0)
(3)以“原假设H0为真”导出一组期望频数(fe)
(5)χ2=∑(f0-fe)2/fe 给定的α查χ2表,得到临界值
(6)比较χ2值与临界值作出检验判断
(4)计算检验统计量χ2=∑(f0-fe)2/fe
检验步骤
注意事项
(1)各组理论频数fe不得小于5,如不足5可合并组;
(2)为使组数不致太少,总频数n>50;
(3)根据具体情况确定自由度。
例题
假定总体为均匀分布的检验
假定总体为正态分布的检验
假定总体为泊松分布的检验
2、独立性检验
检验步骤
(1)对总体的两个变量建立假设
H0:两变量独立
H1:两变量关联
(2)将样本资料编成r×c列联表,并列出实际频数Oij
(4)计算检验统计量
(5)χ2=∑(f0-fe)2/fe 给定的α查χ2表,得到临界值
(6)比较χ2值与临界值
作出检验判断
(3)计算理论频数
理论频数Eij的计算
先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(A·B)=P(A)·P(B)。因此,某一行某一列的联合概率:
自由度为:df=(r-1)(c-1)
例:r·c=3×4
√
√
√
√
√
√
○
○
○
○
○
○
CT1 CT2 CT3 CT4
RT1
RT2
RT3
总行数
总列数
r1
r2
r3
Df=(3-1)(4-1)=6
c1
c2
c3
c4
r·c=2×2的列联表资料,χ2值简算公式
x
y
1
2
1
2
a
b
c
d
a+c
b+d
a+b
c+d
合计
合计
n
成对比较检验
符号检验
1 含义
略去两组样本数据之差的数值,只用其差的正、负符号进行判断的检验方法,亦称正负号检验。
2 检验内容
检验的两组数据是否有显著差异或两总体的位置特征(均值、中位数)是否相同。
3 适用条件
关联样本资料、定性变量
若两组数据没有显著差异,它们之差的“+”、“-”号的个数应大致相等。出现“+”(或“-”)。如果一次抽样的随机样本的配对数据中,“+”号出现过多或过少,在一定显著性水平α条件下属于小概率事件,就说明两组数据的平均水平或相对次数分布并不相同。可见,配对符号检验是二项检验的一种应用。
§ 由于P=,所以,只要n>25, 即可按正态分布近似处理。
4 方法思想
设有关联样本的两组成对的数据xi与yi,比较各对的大小。
若xi>yi ,记作“+”;若xi<yi ,记作“-”;
若xi=yi ,删去,并相应减少n对数据