文档介绍:第12章抽样设计和样本量的确定
第12章抽样设计和样本量的确定
主讲人:刘彦彬
本章主要内容
一、定义总体
二、确定抽样框架
三、选择抽样技术
四、确定样本容量
五、执行抽样过程
抽样设计过程
一、定义总体
定义目标总体
目标总体:是指拥有研究人员所要寻找的信息的个体或物体的集合。
目标总体必须被精确的定义,不精确的定义总体将会导致研究无效,甚至误解;
目标总体应该根据个体、抽样单位、范围和时间来定义;
个体是这样一个物体,关于它的信息或者来自它的信息是我们想要的;
抽样单位是指在抽样过程中的某一阶段可供选择的个体,或者包括这个个体的单位;
范围指的是地理边界;
时间因素是指的调研的时间周期。
统计推断过程
总体
样本
样本统计量(X)
总体参数估计
二、确定抽样框架
确定抽样框架
抽样框架指的是目标总体中的个体的表示法,它由一份或一组用于识别目标总体的指示说明组成
电话本、公司名的协会目录、邮寄名单、姓名地址录或者地图
可能造成抽样框架误差。
有三种办法处理抽样框架误差:
根据抽样框架重新定义总体;
通过数据收集阶段的筛选被访者来考虑抽样框架误差;
通过加权的方案来调整所收集的数据,弥补抽样框架误差。
三、选择一种抽样技术
抽样技术的分类
抽样技术可以被宽泛地分为非概率抽样和概率抽样
非概率抽样依赖于研究人员的个人判断而非随机选择样本个体;
可以对总体的特征很好的估计;
无法对样本结果的精确度作出客观的评价。
概率抽样随机选择样本单位,选择每个样本的概率相等
每个样本不一定有相同的选择概率,但可以指定选择任一给定大小的特定样本的概率;
可以确定样本估计值的精确度;
可以根据个体抽样对整群抽样、相等单位概率对不等概率、非分层抽样对分层抽样、随机选择对系统选择、单阶段技术对多阶段技术,这5个方面所有的可能组和分成32种不同的抽样技术。
抽样技术的分类
抽样技术
非概率抽样
概率抽样
便利抽样
判断抽样
配额抽样
滚雪球抽样
简单随机抽样
系统抽样
分层抽样
整群抽样
便利抽样
以研究者或访问者方便来选择被访者,通常被访者由于碰巧在恰当的时间正处在恰当的地点而被选中
使用学生以及社会组织成员;
商场拦截购物者;
使用费用帐目清单确定的百货商店;
“街上的行人”访谈。
便利抽样在所有抽样技术中成本最低、耗时最少,抽样单位易于接近;
不能代表总体。
判断抽样
判断抽样是便利抽样的一种形式,根据研究人员的判断选出总体中的个体
进行判断的研究人员或专家选出要被包括进样本的个体
是主观的判断,其价值完全取决于研究人员的判断、专业知识以及创造力
缺点是不支持特定总体的直接推断
优点是成本低、便利且快速
配额抽样
配额抽样可以被看成两阶段有约束的判断抽样
第一阶段,由确定总体中的个体的控制类别或者配额组成,配额确保了样本的组成与总体的组成在特定特征方面相同;
第二阶段,样本个体在便利或者判断的基础上被选择出来
缺点是缺乏对总体的代表性,无法计算抽样误差
优点是低成本,并且为每个配额选择个体对访谈人员而言较为容易
滚雪球抽样
通常是先选出一组最初的调查对象,通常是随机选出的,在访谈之后,要求这些被访者推荐一些属于目标总体的其他人,根据这些推选出后面的被访者。
与随机的方式相比,被推举的人将具备与推荐人更为翔实的人口及心理特征。
主要目的是估计总体中非常稀少的某些特征。
缺点是这种方式非常耗时。
简单随机抽样
在简单随机抽样中,总体中每一个个体都有一个已知且相等的抽中概率
首先确定一个抽样框架,其中的每一个个体被分配了一个唯一的号码
然后产生出随机的数字来确定哪些个体被包括进样本中
盲选 Blind Draw
随机数表 the table of random number
优点是易于理解,样本结果可以推断总体,大多数统计推论方法都假定数据是由简单随机抽样法法获得的
局限性:抽样框难以构建;数据收集时间和成本高;比其他概率抽样精确度低,标准差较大。
系统抽样
在系统抽样中,通过选择一个随机的起点,然后从抽样框架中连续地每隔i个个体选出一个个体,从而选出样本。
这种方法成本较低,因为只需要做一次随机抽样
可以在不了解抽样框的组成的情况下进行
分层抽样
分层抽样是一个两阶段过程,总体被分割为子总体,或称为“层”后,再用随机方法,从每一层中选出个体。
各层间应相互独立,并且全体上没有遗漏;
与配额抽样法的不同是子总体的样本选取是随机的;
分层抽样可以确保子总体在样本中都得以体现。
整群抽样
首先将目标总体分为相互排斥且没有遗漏的子总体,或称群,然后根据一种概率抽样