文档介绍:第五章抽样与抽样估计
第五章抽样与抽样估计
重点:不同抽样组织形式的抽样误差计算;总体均值及比例的区间估计;必要抽样数目的计算方法。抽样估计的基本理论;抽样误差的含义与计算方法;区间估计问题。
难点:抽样估计的基本理论;抽样误差的含义与计算方法;区间估计问题。
所需课时:7课时
本章主要内容
第一节有关基本概念
第二节抽样分布
第三节抽样误差
第四节抽样估计
第一节有关基本概念
一、总体和样本
二、必要样本量和样本可能数目
三、抽样框
四、抽样效率与设计效果
五、抽样的类型
六、几种主要的概率抽样方法
总体是指研究对象的全体`,它是由研究对象中的单元组成的。总体中包含单元的数目称作总体容量(或大小);样本是指抽样时按照抽样的规则所抽中的那部分单元所组成的集合。
总体
样本
抽取样本
推断总体
一、总体和样本
抽样调查中的总体是有限的。在抽样以前,必须根
据实际情况把总体划分成若干个互不重叠并且能组合成
总体的部分,每个部分称为一个抽样单元,不论总体是
否有限,总体中的抽样单元数一定是有限的,而且是已
知的,因此说抽样调查的总体总是有限的。
抽样调查中影响样本代表性的因素有以下几个方面:
(1)总体标志值分布的离散程度。
(2)抽样单元数的多少(或称样本量的大小)。
(3)抽样方法。
通常将反映总体数量特征的综合指标称为总体参
数。常见的总体参数主要有:总体总和;总体均值;总
体比率;总体比例。
一般将反映样本数量特征的综合指标称之为统计
量。统计量是n元样本的一个实值函数,是一个随机变
量,统计量的一个具体取值即为统计值。主要的样本统
计量有:样本总和;样本均值;样本比率;样本比例。
样本中包含的抽样单元个数称为样本容量,又称样本含量或样本大小。必要样本量是能够满足估计精度要求的最少样本量。
样本可能数目则是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数。用A表示。当N和n一定时,A的多少与抽样方法有关,其计算方法列表如下:
不考虑顺序
考虑顺序
不放回抽样
放回抽样
抽样方法
二、必要样本量和样本可能数目
抽样框是在抽样前,为便于抽样工作的组织,在可
能条件下编制的用来进行抽样的、记录或表明总体所有
抽样单元的框架,在抽样框中,每个抽样单元都被编上
号码。抽样框可以是一份清单(名单抽样框)、一张地
图(区域抽样框)。
编制抽样框是一个实际的、重要的问题,因此必须
要认真对待。
常见的抽样框问题可以概括为四种基本类型:
(1)缺失一些元素,即抽样框涵盖不完全;
(2)多个元素对应一个号码;
(3)空白或存在异类元素;
(4)重复号码,即一个元素对应多个号码。
对抽样框存在的缺陷要认真对待,有效处理。
三、抽样框
在样本容量相同的情况下,抽样方差越小表明抽样效率越高。设计效果是设计方案的方差与简单随机抽样的方差之比。设计效果通常用英文字母Deff表示:
四、抽样效率与设计效果
抽样调查
非概率抽样:采用非随机的方法从总体中抽选单元
概率抽样:基于随机的原则从总体中抽取单元
五、抽样的类型
(一)非概率抽样
8>
非概率抽样是用非随机的方法抽选样本。
优点:
快速简便;
费用相对比较低;
不需要任何抽样框;
对探索性研究和调查设计的开发很有用。
缺点:
不能对总体进行推断;
由于不知总体单元的入样概率,故不能计算估计
值的抽样误差。
23>.各种非概率抽样方法
随意抽样。样本单元的抽选以随意的方式进行。如街道拦截访问。
志愿者抽样。被调查者都是自愿参与调查。如网上问卷,自愿回答。
判断抽样。由专家有目的地挑选“有代表性”的样本进行调查。如典型调查。
配额抽样。从总体的各个子总体中选取特定数量的样本单元组成样本。如市场调查中,规定男女消费者的样本各多少。
滚雪球抽样。适合于总体中某种较为稀少的特殊子总体而又缺少完整的抽样框。抽样时通过已知的少数个体获得信息逐渐扩大。
概率抽样是从总体中随机抽选样本单元,被抽中的单
元既不取决于调查人员的愿望,也不取决于被被调查者的
态度。其次每一个单元都有一定的概率被抽中。
优点:
可以对总体进行推断,并能计算估计值的抽样误差。
缺点:
相对于非概率抽样,设计比较复杂,而且费用也比较高。
常见的概率抽样方法主要有:
简单随机抽样、系统抽样、与大小(或规模)成比例的
概率(PPS)抽样、整群抽样、分层抽样(STR)、多阶抽样、
以及多相抽样等。
(二)概率抽样
(一)简单随机抽样
1、定义: