文档介绍:1 简单随机抽样的定义与抽选方法
一、定义
从大小为N的总体抽取样本量为n的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。
根据抽样单位是否放回可分为放回简单随机抽样和不放回简单随机抽样法
两个引理
简单估计量的定义
样本均值是总体均值的无偏估计。
第二十页,共78页。
Q1:估计量的精度与抽样比的关系大吗?
A1: 当N很大时,抽样精度基本取决于样本量n,而与抽样比几乎无关。
Q2: 进行人口抽样调查,如果需要各个省的数据,要达到相同的精度,大省和小省所需要的样本量几乎相同还是相差很大?
A2:几乎相同。虽然此时抽样比相差很大,但如果抽样比相同,必然会导致小省精度不够,大省抽样过多而浪费。
第二十一页,共78页。
一点解释:1-f
1-f:fpc (finite population correction )有限总体校正系数
总体未入样率
从一无限总体中抽取一个样本容量为n的随机样本
一般而言,当抽样比小于5%时,fpc 可以忽略不计算,这样的话估计量的标准差就估计的稍微高一些。
第二十二页,共78页。
简单估计量方差的无偏估计
证明:说明样本方差是总体方差的无偏估计即可。
根据对称性论证法和方差性质
第二十三页,共78页。
简单估计量的性质小结
第二十四页,共78页。
具体例子
例:从一个容量为100的总体中抽出样本容量为10的简单随机样本,要估计总体平均水平,并给出置信度为95%的置信区间。
序号i
1 2 3 4 5 6 7 8 9 10
yi
4 5 2 0 4 6 6 15 0 8
95%的置信区间为, 5+×]=[,]
第二十五页,共78页。
例:从一个容量为100的总体中抽出样本容量为10的简单随机样本,
序号i
1 2 3 4 5 6 7 8 9 10
yi
4 5 2 0 4 6 6 15 0 8
续上
若问: (2)估计总体的总量以及95%的置信区间。
95%的置信区间为, 5+×]=100×[,]=[243,757]
(3)总体均值估计的绝对误差和相对误差
第二十六页,共78页。
(三)
放回简单随机抽样的简单估计量
有放回抽样的精度低于不放回抽样的精度。
第二十七页,共78页。
百分数的估计及其误差
在问卷调查中对某个问题的回答为“是”或“否”的情况:若某个问题的答案只有两个,“是”或“否”,则选择“是”或“否”的比例 即是需要估计的总体比例
多项选择题:某个问题有5种可选答案A、B、C、D、E,每人可任意选择一项,那么对答案A而言,每个人的选择可以是“A”或“非A”,由此“选择A的比例”即是需要估计的总体比例。同理,选择B、C、D及E的比例都是我们需要估计的总体比例。
总体比例常用百分数来表示,有时也俗称为成数。
第二十八页,共78页。
如果我们只关心总体中某些特定类型的集合占整个总体的比例,那么我们的盒子模型中的票子分为两类:我们感兴趣的全标为1,其余全标为0。于是盒子成为:
1
0
0-1盒子模型
第二十九页,共78页。
具有该种属性的比例为:
(1)具有某种属性单位的个数N1的估计就是对总体总值估计
(2)对总体比例的估计就是对总体均值的估计
第三十页,共78页。
方差用比例表示
总体方差
样本方差
第三十一页,共78页。
估计量的定义和性质
估计量的性质
第三十二页,共78页。
第三十三页,共78页。
(1)当N,n,N-n都比较大时,a(样本中1的个数)近似服从正态分布,
(2)当N很大,但n不是很大时,a近似服从二项分布。二项分布是个离散分布,而正态分布是个连续分布,因此可将其进行连续性修正。P经修正后的近似置信区间为:
第三十四页,共78页。
应用举例
例 :某超市开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。于是在总体中抽取了一个样本容量为200人的样本。调查发现对该超市的购物环境表示满意和基本满意的居民有130位,请估计对超市购物满意的居民的比例,并在置信度为95%下,给出估计的绝对误差,相对误差和变异系数coefficient of variation和置信区