文档介绍:定量研究方法:推断统计
中山大学梁宏
内容提要
抽样的意义是什么?
为什么随机样本可以代表总体?随机样本和总体是通过什么联系起来?
什么是抽样分布?
了解不同统计量及样本量对应的抽样分布
样本统计量推断总体特征:参数估计
样本统计量检验总体参数:假设检验
了解不同情况下的总体检验
抽样的意义
抽样的意义:
社会科学研究关心的是总体情况,而非样本情况;
抽样的意义和过程
抽样分布——概念要点
抽样分布是根据机率的原则而成立的理论性分布,显示由同一总体中反复不断抽取规模相同的样本时,各个可能出现的样本某个统计值的分布情况。
所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布
是一种理论概率分布
随机变量是样本统计量
样本均值, 样本比例等
结果来自容量相同的所有可能样本
样本均值的抽样分布
样本均值的抽样分布
样本均值的抽样分布
所有样本均值的均值和方差
样本均值的分布与总体分布的比较
均值抽样分布的特征
如果样本相当大(n大于30),则抽样分布接近正态分布;
任合两值之间的样本均值次数所占的比例是可知的;
抽样分布的均值就是总体均值;
抽样分布的标准差称为标准误(差),是总体标准差除以样本大小(n)的平方根;
中心极限定理(图示)
T 统计量的分布
样本比例的分布与总体分布的比较
二项抽样分布
二项,即所研究的变量只有两个值,如“是”与“否”。
样本比例的分布情况
样本中“是”的几率为:p(r) = n! Pr Qn - r / r! (n - r)!
公式表示样本获得 r 次“是”的机率。其中,n为样本数,r为“是”的次数,P为每次“是”的机会,即总体中“是”的比例,Q为每次“不是”的比例。
当样本量较大(最好n>=100)时,可将二项分布近似为正态分布
样本方差的抽样分布
两个样本方差比的抽样分布
参数估计
只要采用随机抽样法,就可根据抽样分布,以样本统计值来推测总体情况。即根据一个随机样本的统计值来估计总体参数是多少。
参数估计方法:
点估计:以一个最适当的样本统计值来代表总体的参数值;理论基础是抽样分布;但是,没给出估计值接近总体未知参数程度的信息;
区间估计:以一个区间去估计总体参数值;根据一个样本的观察值给出总体参数的估计范围,并给出总体参数落在这一区间的概率。例如: 总体均值落在50~70之间,可信度为 95%
落在总体均值某一区间内的样本
假设检验
假设:对总体参数的一种看法
总体参数包括总体均值、比例、方差等;
分析之前必需陈述;
假设检验:
事先对总体参数或分布形式作出某种假设;
然后利用样本信息来判断原假设是否成立;
方法的特点:
采用逻辑上的反证法;
依据统计上的小概率原理;
假设检验的步骤
根据研究假设(H1)成立与其对立的虚无假设(H0);
选择适当的统计量和检定统计法,并要列举其假设或要求;
决定显著度a;
根据样本资料计算检定值,从而作出决策。
研究假设和虚无假设
研究假设
根据理论或经验提出的有待探讨、研究的假设。
虚无假设
与研究假设对立的假设;
根据它来确定抽样分布,然后求出它是正确的可能性。
假设检验的基本原则是直接检验H0,因而间接地检验H1,目的是排除抽样误差