文档介绍:如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
第一章
统计:收集、处理、分析、解释数据并从数据中得出结论的科学。
数据1. 分类数据 对事物进行分类的结果数据,表现为类别,用文字来表述. 例如,人口按性别分为男、女两类
2. 顺序数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据 对事物的精确测度,:身高为175cm ,168cm,183cm
总体– 所研究的全部元素的集合,其中的每一个元素称
为个体– ,,不可数的
样本– 从总体中抽取的一部分元素的集合– 构成样本的元素数目称为样本容量
参数:描述总体特征。有总体均值(m)、标准差(σ)总体比例(π)统计量:描述样本特征。样本标准差(s),样本比例(p)
变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。经验,理论变量
描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计是研究如何利用样本数据进行推断总体特征
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
第二章
间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。再一个是实验。
概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中– 每个单位被抽中的概率是已知的,或是可以计算出来的– 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率
简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的
分层抽样:
优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度– 组织实施调查方便– 既可以对总体参数进行估计,也可以对各层
的目标量进行估计
整群抽样: 将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查
优点: 抽样时只需群的抽样框,可简化工作量– 调查的地点相对集中,节省调查费用,方便调查的实施– 缺点是统计的精度较差
系统抽样: 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的
规则确定其它样本单位– 先从数字1到k之间随机抽取一个数字r作为
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
初始单位,以后依次取r+k,r+2k…等单位
操作简便,可提高估计的精度
多阶段抽样: 先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查– 群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样
非概率抽样:方便抽样(自行确定入抽样本单位),判断抽样(根据经验判断),自愿样本(被调查者自愿参加),滚雪球抽样(对稀少群体的调查),配额抽样(先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位)。
概率抽样与非概率抽样的比较
1. 概率抽样
– 依据随机原则抽选样本– 样本统计量的理论分布存在– 可根据调查的结果推断总体
2. 非概率抽样
– 不是依据随机原则抽选样本– 样本统计量的分布是不确定的 无法使用样本的结果推断总体
数据收集的方法:自填式,面访式,电话式
数据误差:抽样误差(样本量的大小),非抽样误差。误差的控制
统计数据的质量要求
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
1. 精度:最低的抽样误差或随机误差2. 准确性:最小的非抽样误差或偏差3. 关联性:满足用户决策、管理和研究的需要4. 及时性:在最短的时间里取得并公布数据5. 一致性:保持时间序列的可比性
6. 最低成本:以最经济的方式取得数据
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
如果您需要使用本文档,请点击下载按钮下载!
第三章
数据审