文档介绍:统计学上的定义(dìngyì)和计算公式
SPSS单样本(yàngběn)K-S检验
定义:K-S(Kolmogorov-Smirnov)检验它是检验单一样本(yàngběn)是否来自某一特定分布的方法。
它的检验方法是以样本(yàngběn)数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本(yàngběn)取自某特定分布族。
第1页/共20页
第一页,共21页。
假设检验问题:H0:样本所来自的总体分布(fēnbù)服从某特定分布(fēnbù)H1:样本所来自的总体分布(fēnbù)不服从某特定分布(fēnbù)
第2页/共20页
第二页,共21页。
F0(x)表示理论分布的分布函数,Fn(x)表示一组随机样本的累计频率函数。
设D为F0(x)与Fn(x)差距的最大值,定义如下式:D=max|Fn(x)-F0(x)|
结论:当实际观测D>D(n,α)(D(n,α)是显著水平为α样本容量为n时,D的拒绝临界值),则拒绝H0,反之(fǎnzhī)则接受H0假设。
第3页/共20页
第三页,共21页。
D(n, α)的简略(jiǎnlüè)表
第4页/共20页
第四页,共21页。
以Kolmogorov-Smirnov正态性检验为例介绍它的统计原理。例1:35位健康男性在未进食前的血糖浓度如表所示,试测验(cèyàn)这组数据是否来自正态分布87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 72 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35
第5页/共20页
第五页,共21页。
检验过程如下:H0:健康(jiànkāng)成人男性血糖浓度服从正态分布H1: 健康(jiànkāng)成人男性血糖浓度不服从正态分布
经计算,样本的均值μ=80,标准差σ=6,这便可以作为对原假设,正态分布的参数估计值,运用于检验计算中。
第6页/共20页
第六页,共21页。
D值序列(xùliè)的计算结果
得到D统计(tǒngjì)
第7页/共20页
第七页,共21页。
χ2检验(jiǎnyàn)与Kolmogorov-Smirnov检验(jiǎnyàn)的区别
χ2检验与Kolmogorov-Smirnov检验都采用实际频数和期望频数进行检验。它们之间最大的区别在于前者主要用于类别(lèibié)数据,而后者主要用于有单位的数量数据,有时前者也可以用于数量数据但必须将数据分组得到实际观测频数,并要求多变量之间独立,而后者可以不分组直接把原始数据进行检验因此k-s检验对数据的应用较完整。
第8页/共20页
第八页,共21页。
第9页/共20页
第九页,共21页。
SPSS在统计中将计算K-S的Z统计量,并依据(yījù)K-S分布表(小样本)或正态分布表(大样本)给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α,则应拒绝零假设H0,认为样本来自的总体与指定的分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为样本来自的总体与指定的分布无显著差异。
第10页/共20页
第十页,共21页。