文档介绍:非参数检验
χ2拟合优度检验
一、χ2检验概念
χ2检验是检验样本测量频数与期望频数的差异性。
例如:在某次考试结束后,对不同成绩进行统计的结果:
分数段期望频数Ei 测量频数Qi
0-60分 0 1
60-75分 4 6
75-85分 8 8
85-100分 4 3
按照公式:
经过查表可得到P
P>α不显著
P<= α显著
H0假设:样本的测量频数Qi与期望频数Ei差异不显著。
二、操作步骤
执行[Analyze][Nonparametric Test][Chi-Square]
选择检验变量到“Test Variables”检验变量窗口中
回答期望值“Expected values”:
“All categories equal”表示均匀分布,即每项的频数都相等。缺省选项:总频数/分组数,这是一种平均分布
“Values”为指定各个项的频数。
检验变量取值范围“Expected Range”:
“Get from data”为不限定。
“Use specied range”指定上下限。
“Exact”可以定义各种不同分布下的显著性检验,使计算更精确:
“Asymptotic only”适合于渐进分布的大样本分布。
“Monte Carlo”适合不满足渐进分布的大样本分布。
“Confidence”指定置信区间。
“Number of”指定近似法计算中的个案数。
“Exact”精确计算统计概率。
“Options”中可以设置选项:
“Descriptive”中将计算描述统计:
均值、标准差、最大值、最小值等。
“Quartiles”四等分百分位数的计算。
缺失值“Missing Value”:
“Exclude cases test by test”表示排除在做统计分析的变量中含有缺失值的个案。
“Exclude cases listwise”表示排除在检验变量列表中开列的变量中含有缺失值的个案。
三、命令语句
NPAR TEST
/CHISQUARE=检测变量
/EXPECTED=对应的期望频数
/MISSING ANALYSIS.
四、应用举例
某地区的人口消费结构在83年和90年的统计数字如下:
食品衣物住房燃料日用品非商品支出
83年 53
90年
建立一个数据文件:变量cost 为44个1、11个2、15个3、16个5、9个6
检测变量:cost
期望值定义:53 13 12 6 14 3
分析结果:=.010,所以85年的消费结构同90年的消费结构差异显著。
二项分布检验
一、二项分布检验概念
对于某分布,假定低于某指定值V的百分比占P0。如果该假设成立,则分布将满足一个规律。
H0假设:样本组中低于等于某值V的个案占百分比P0。
二、操作步骤
执行:
[Analyze][Nonparametric][Binomial]
选择变量(必须是数值型变量)到Test Variables检验变量窗口
定义分界值“Define Dichotomy”:
“Get from data”为自动分界,即变量值中只有两类数值。
“Cut point”定义分界值,检验小于该值的观测值。
“Test”定义检验百分比,例如:.10 , .。
“Exact”可以定义各种不同分布下的显著性检验,使计算更精确:
“Asymptotic only”适合于渐进分布的大样本分布。
“Monte Carlo”适合不满足渐进分布的大样本分布。
“Confidence”指定置信区间。
“Number of”指定近似法计算中的个案数。
“Exact”精确计算统计概率。
按钮“Options”中可以设置选项:
统计描述“Descriptive”中将计算:
均值、标准差、最大值、最小值等。
“Quartiles”四等分百分位数的计算。
缺失值“Missing Value”:
“Exclude cases test by test”表示排除在做统计分析的变量中含有缺失值的个案。
“Exclude cases listwise”表示排除在检验变量列表中开列的变量中含有缺失值的个案。
三、命令语句
NPAR TEST
/BINOMIAL (检验百分比)= 检验变量(分界值)
/MISSING ANALYSIS.
四、应用举例:
设有若干块实验田,亩产(公斤)如下:
623 702 674 680 736 695
801 638 721 690 655 741
H0假设:产量低于650公斤的地只占10%。
Category N Observed Prop. Test Prop. Exact Sig.