1 / 84
文档名称:

数据收集【PPT课件】.ppt

格式:ppt   大小:834KB   页数:84页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据收集【PPT课件】.ppt

上传人:aluyuw1 2022/6/8 文件大小:834 KB

下载得到文件列表

数据收集【PPT课件】.ppt

相关文档

文档介绍

文档介绍:第 二 章 数据收集
第一节 数据的直接来源与间接来源
第二节 数据的收集方法
第三节 问卷设计
第四节 收集数据的误差
第一节 数据来源
——样
有放回抽样:也称为重复抽样,在一个单位被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程。
无放回抽样:也称为不重复抽样,在一个单位被选入样本后,不再放回总体参与随后的抽样过程。
问题:不重复抽样中每个个体被选中的概率相等吗?
*
抽选样本单位的方法
从N个总体单位中抽选n个单位组成样本,可以先将N个单位编号,若抽到某个号则对应的单位入样。通常有抽签法和随机数法两种抽选方法。
抽签法:用均匀同质的材料制作N个签并充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,直至抽满n个签为止。
随机数法:
随机数表
随机数骰子
摇奖机
计算机产生的伪随机数
*
随机数表的使用
39 65 76 45 45 19 90 69 64 61 20 26 36 31 62 …
73 71 23 70 90 65 97 60 12 11 98 40 07 17 66 …
72 20 47 33 84 51 67 47 97 19 98 40 07 17 66 …
75 17 25 69 17 17 95 21 78 58 24 33 45 77 48 …
37 48 79 88 74 63 52 06 34 30 01 31 60 10 27 …
02 89 08 16 94 85 53 83 29 95 56 27 09 24 43 …
… … … … … … … … … … … … … … … … … …
*
简单随机抽样最适用的场合
当总体内样本单位不多,且有完备名册,可用于编号时
对研究的目的而言,总内样本单位间的差异不大时
无法充分获得总体信息时
由于编制抽样框及抽取的样本可能过于分散等原因在实际实施中有一定困难,加之没有利用其他辅助信息提高估计的效率,所以大规模调查中很少直接采用。
*
(2)系统抽样 (Systematic Sampling)
系统抽样(也称等距抽样):将总体N个单位按某 种顺序排列,按规则确定一个随机起点,再每隔一 定间隔逐个抽取样本单位的抽样方法。
直线等距抽样:
将总体分成n个组,每组有 k=N/n个单位。
在第一组随机选择一个单位,之后每隔k个选择一个。
N = 64
n = 8
k = 8
第一组
*
等距抽样的特点
等距抽样可分为无关标志排队和有关标志排队。
按无关标志排队:各单元的排队顺序与所研究的内容无关
按有关标志排队:各单元的排队顺序与所研究的内容有关系。
优点:抽取样本简便易行,易于监控。
主要适用场合
总体内的样本单位,对有兴趣的指标而言是随机的或按大小排列的
总体内单位数过多,而抽取的样本又较多时
总体内的单位数不能确定时(例如抽取学号最后一位为8的学生进行调查)
*
按无关标志排队时等距抽样的特点
按无关标志排队时,如果单位的排列存在周期性,而抽样间隔又恰好与周期的长度一致时,样本的代表性可能很差
样本
*
按有关标志排队时等距抽样的特点
按有关标志排队时,相应的指标数值有线性趋势,按 照普通的等距抽样方法会导致样本指标的偏大或偏小。
为了避免这一问题需要采取对称等距抽样的方法。
这时样本单位在总体中分布比较均匀,有利于提高估计的精度。
直线等距
对称等距
对称等距
*
(3)分层抽样 Stratified Sampling
也称分类抽样或类型抽样。即先将总体所有单位按某种标志划分为若干层,然后从各层中随机抽取一定数目的单位构成样本,根据各层样本汇总对总体指标作出估计的一种抽样方式。
男生
女生
样本
*
分层抽样的特点
可以提高样本的代表性,提高估计的精度。
在估计总体参数的同时还能估计每层的参数。
抽样误差只受层内方差的影响,分层时应使层间方差大、层内方差小。
最适用的场合:
当总体内样本单位的差异较大时;
分层后能达到层间差异大,层内差异小的原则时
*
按比例分层抽样和不按比例分层抽样
按比例分层抽样:各层的抽样比例都相等(等于n/N)。
在有些情况下,为了降低抽样误差或者对各层的参数进行较好的估计,需要采用不按比例分层抽样。
在不按比例的分层抽样中如果要用样本资料推断总体,需要对各层的数据资料进行加权处理。