文档介绍:生物统计与计算机辅助分析
Biostatistics puter Aid Analysis
主讲教师:
关瑞章冯建军
林鹏谢钦铭
郭松林黄文树
江兴龙黄良敏
2007-6-15
第三章抽样分布
从一个正态总体中抽取的样本统
计量的分布
从两个正态总体中抽取的样本统
计量的分布
2007-6-15
第三章抽样分布
•生物统计学的最基本问题是研究总体与样本间
的关系。总体有两类:一是由实际研究对象构
成的总体;二是数字的总体。前者可转化为后
者。生物统计研究的是数字总体。
•总体与样本之间的关系,有以下两个途径:
–总体已知,研究样本的分布规律,即由总体
到样本;
–总体未知,由样本推断,即由样本到总体。
•本章研究的是第一个问题:即从总体至样本。
2007-6-15
从一个正态总体中抽取的样本统计量的分布
–从一个已知的总体中,独立随机的抽取含量为
N的样本,研究所得的样本的各种统计量的概
率分布,称为抽样分布.
–生物学中遇到的最多的研究对象是正态总体,
对于正态总体,可以用数学推演的方法,得出
严格的样本统计量的抽样分布。
2007-6-15
样本平均数的分布
•标准差已知时平均数的分布服从正态分布
–平均数服从N (μ,σ2/n)
x −μ
u =
σ
–其标准化公式:
σ n
–标准化的分母( )称为
n
平均数的标准误差。
2007-6-15
标准差未知时平均数的分布服从 t 分布
σ未知时可用样本标准差代替总体标准差,
标准化变量并不服从正态分布,而服从具n-1自
s
由度的 t 分布,其分母(n )称为样本标准误
差。自由度是指独立观测值的个数。
t分布的密度函数
x −μ
t = df + )1
s Γ( ) 2 df +1
t −
tf )( = 2 + 2 ,)1( t ∞<<−∞
n df df df
df πΓ()( )
2
2007-6-15
标准差未知时平均数的分布服从 t 分布(续)
t分布的μ特征数:
df
df ),1(0 σ=>= df > 2( ),
γ t t df − 2
6
:1t df ),3(0 γ:2 t =>= df > )4(
df − 4
随着自由度的增加,t分布接近于标准正
态分布。当自由度较大时的t分布可以
近似地按N(0,1)分布处理。
自由度:指独立观测值的个数。
2007-6-15
不同自由度下的 t 分布
2007-6-15
t分布分位数表(分位数表的图示)
t分布的单侧分位数和双侧分位数(附表
4)
–上侧分位数:P(t>tα)=α时的ta值;
–下侧分位数: P(t<tα)=α时的ta值;
–双侧分位数: P(ltl>tα/2 )=α时的ta值
x −μ
t =
s
t、n、自由度、s之间的关系。
n
2007-6-15
样本方差s2的分布
•研究样本方差S2的分布时,首先按下式标准
化:
2 =(n-1) 2 /σ2
χ df s
得到一个不带任何单位的纯数,该纯数服从n-
1自由度的卡方分布。
•χ2分布是概率曲线随自由度而改变的一类分
χ
布,其密度函数为:χ
df χ 2
1 −−
2 2 2 eK 2 χ 2 > 0,)(
fdf = {)( 2
,0χχ<0
2007-6-15