文档介绍:第七章统计抽样
第七章统计抽样
本章系统介绍统计抽样基本概念以及简单随机抽样、分层抽样、整群抽
样以及系统抽样相关理论。
统计抽样基本概念
在前面我们给出了总体和样本的定义,即
·总体由研究对象的全体所组成。
·样本是总体中的部分元素所组成的集合。
为说明这些概念,我们以四川长虹电子集团公司为例。为了制定企业下
一步战略,该公司打算对其液晶电视机购买者进行一次调查。本次抽样调查
的对象是长虹液晶电视机的购买者。总体由购买长虹液晶电视机的所有人组
成,样本是长虹液晶电视机购买者的一个子集。
在抽样调查中,有必要区分目标总体与抽样总体。目标总体是我们要推
断的总体,抽样总体是实际抽取样本的总体,这两个总体不总是一致的,明
确这一点非常重要。在长虹电子集团公司的例子中,目标总体是购买长虹液
晶电视机的所有人,抽样总体是将保修登记卡寄回长虹电子集团公司的所有
液晶电视购买者。由于有一些长虹液晶电视购买者并没有寄回保修卡,其抽
样总体和目标总体是不一致的。抽样调查获得的结果只适用于抽样总体,这
些结果是否能扩展到目标总体需要依靠分析家的判断。
在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个简单的
个体,也可以是一组个体。假设我们要调查持有律师资格证书的专业律师。
如果可以利用所有专业律师名册,则抽样单位就是我们所要调查的专业律
师。如果这样的名册不可利用,我们就必须依靠其他方法来找到调查对象。
我们可以利用电话号码簿,查出所有律师事务所的名册,进而调查专业律师。
这时,抽样单位是指每一家律师事务所。
在具体研究中,抽样单位的名册称为抽样框。在专业律师调查中,如果
专业律师名册不可以利用,那么律师事务所名册就是抽样框。在实际抽样调
查过程中,编制抽样框是一个既困难又重要的步骤。
— 103 —
第七章统计抽样
抽样调查种类和抽样方法
最常用的三种调查是邮寄调查、电话调查和个人采访调查,而且每一种
调查都需要设计和使用调查表。
在使用调查表的调查中,设计调查表是非常关键的问题。设计者必须要
抵制想囊括所有要研究问题的诱惑,因为每增加一个问题都会增加调查表的
长度。长的调查表不仅使回答者感到疲劳,也使采访者感到疲劳,尤其对邮
寄和电话调查更是如此。但是,如果用个人采访调查,较长而且复杂的调查
表是行得通的。
根据使用的抽样方法,抽样调查可分为概率抽样和非概率抽样。用概率
抽样,可以计算出取得的每个可能样本的概率;用非概率抽样,则无法得知
取得每个可能样本的概率。如果调查者想对估计的精度做出说明,应采用概
率抽样。根据给定的允许误差,采用概率抽样方法可构造相应的置信区间。
在后面几节中,我们将讨论四种概率抽样方法:简单随机抽样、分层简单随
机抽样、整群抽样和系统抽样。
尽管统计学家喜欢用概率抽样方法,但非概率抽样方法常常是必要的。
非概率抽样的优点是成本低且容易完成;缺点是不能对估计的精度做出准确
的说明。两种最常用的非概率抽样方法是方便抽样和判断抽样。
方便抽样是根据调查者的方便性,以无目标、随意的方式进行的抽样调
查活动。例如,一名教授在大学里进行一项调查研究,他可以邀请他的学生
参加他的研究项目,仅仅是因为这些学生在他的班上。这时,学生样本称为
方便样本。常见的街头拦访和随意的入户访问也是方便抽样的常见形式。
尽管方便抽样是选择样本和收集资料的一种相对简单的方法,但是对这
样取得的样本统计量,无法评价由它们所估计出的总体参数的“优良性”。
有时,研究人员将方便样本看成是一个随机样本,但是这样得出的结论会受
到质疑。因此,用方便样本对总体参数进行推断时,必须非常小心。
在非概率抽样技术中,根据个人的主观意识来选择对总体有代表性的抽
样单位的方法,称为判断抽样。尽管判断抽样常常是选择样本的一种相对容
易的方法,但调查结果的使用者必须清楚地认识到,这些结果的质量依赖于
个人在选择样本时的判断。因此,用判断样本对总体参数进行统计推断时也
应非常小心。
— 104 —
第七章统计抽样
调查误差
进行抽样调查可产生两类误差,一类是抽样误差,它是所得到的样本点
估计值与总体参数之间的数量差异。换句话说,抽样误差是由于没有对总体
的所有单位进行调查而产生的误差;另一类是非抽样误差,它包括进行一次
抽样调查可能出现的所有其他类型的误差,如测量误差、采访者误差及数据
处理误差等。抽样误差仅出现在抽样调查中,而非抽样误差则既可以出现在
普查中,也可以出现在抽样调查中。
.