文档介绍:概率论与数理统计第12讲
1
§4 区间估计
2
对一个未知量, 人们在测量或计算时, 常不以得到近似值为满足, 还需估计误差, 即要求知道近似值的精确程度(亦即所求真值所在的范围). 类似地, 对于未知参数q, 除了求出它的点估计外, 还希望估计出一个范围, 并希望知道这个范围包含参数q真值的可信程度. 这样的范围通常以区间的形式给出, 同时还给出此区间包含参数q真值的可信程度. 这种形式的估计称为区间估计.
3
置信区间设总体X的分布函数F(x;q)含有一个未知参数q, q(Q是q的可能取值范围), 对于给定值a(0<a<1), 若由样本X1,X2,...,Xn确定的两个统计量q = q(X1,X2,...,Xn)和`q =`q(X1,X2,...,Xn)(q <`q), 对于任意q 满足P{q(X1,X2,...,Xn) < q <`q(X1,X2,...,Xn)}1-a ()则称随机区间(q ,`q)是q的置信水平为1-a的置信区间, q 和`q分别称为置信水平为1-a的双侧置信区间的置信下限和置信上限.
4
当X是连续型随机变量时, 对于给定的a, 总是按要求P(q < q <`q)=1-a求出置信区间, 而当X是离散型随机变量时, 对于给定的a, 常常找不到区间(q ,`q)使得P(q < q <`q)恰为1-a. 此时去找区间(q ,`q)使得P(q < q <`q)至少为1-a, 且尽可能地接近1-a.
5
()式的含义为:若反复抽样多次(各次得到的样本的容量相等, 都是n), 每个样本值确定一个区间(q ,`q), 每个这样的区间要么包含q的真值, 要么不包含q的真值, 按大数定律, 包含q真值的约占100(1-a)%, 不包含q真值的约占100a%, 例如, 若a=, 反复抽样1000次, 则得到的1000个区间中不包含q真值的约仅为10个.
6
区间估计的图示
q
7
例设总体X~N(m,s2), s2为已知, m为未知, 设X1,X2,...,Xn是来自X的样本, 求m的置信水平为1-a的置信区间.解
参数.
8
按标准正态分布的上a分位点的定义, 有
0
a/2
za/2
a/2
-za/2
9
这样就得到了m的一个置信水平为1-a的置信区间
常写成
10