文档介绍:data05-02为某公司工资数据(n=15)。使用变量性别sex、收入高低earnings分析男女经理间薪金是否平等。
可以利用data05-01中的数据,使用变量occcat80为工作性质分类,region为地区,childs为每个家击按钮,弹出Exact Tests子对话框,如图4-9-2所示。
图4-9-2 Exact Tests子对话框
Exact Tests子对话框是针对2*2以上的行*列表设定计算确切概率的方法,可以是不计算(Asymptotic only)、蒙特卡罗模拟(Monte Carlo)或确切计算(Exact)。其中,系统默认是不计算;蒙特卡罗模拟默认进行10000次模拟,给出99%置信区间;确切计算默认计算时间限制在5分钟内。这些默认值均可更改。
6-7 单击按钮,弹出Statistics子对话框,用于定义所需计算的统计量。如图4-9-3所示。
图4-9-3 Statistics子对话框
Statistics子对话框包括:
(1)Chi-square复选框:选择是否进行卡方检验,计算值。
(2)Correlaitons复选框:计算列联表两变量的Pearson相关系数和Spearman等级相关系数。
(3)Nominal复选框组:选择是否输出反映分类资料相关性的指标,共有四个选项:
Contingency coefficient复选框:列联系数,其值界于0~1之间,取值越大说明两变量之间的相关性越强。
Phi and Cramer’s V复选框:这两者也是基于值的,Phi在四格表检验中界于-1~1之间,在R*C表检验中界于0~1之间;Cramer’s V则界于0~1之间。该指标的绝对值越大,说明两变量之间的相关性越强。
Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测因变量好,为0时表明自变量预测因变量差。
Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差(表示使用一个变量的值来预测其他变量的值可能发生的错误程度),其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。
(4)Ordianl复选框组:选择是否输出反映定序资料相关性的指标。包括以下组成部分:
Gamma复选框:界于-1~1之间,所有观察实际数集中于左上角和右下角时,其值为1,取1和-1代表两变量完全一致或不一致,取0代表两变量完全不相关。
Somers’d复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例。界于-1~1之间,结果解释同上;
Kendall’s tau-b复选框:界于-1~1之间,计算过程包括结,结果解释同上;
Kendall’s tau-c复选框:界于-1~1之间,结果解释同上;
(5)Nominal by Interval:Eta复选框:计算Eta值,用于分类变量的检验,其平方值可认为是因变量受不同因素影响所致方差的比例;
(6)Kappa复选框:计算Kappa值,即内部一致性系数。;;
(7)Risk复选框:计算相对危险系数,表明事件的发生和某因素之间的关联性。如果大于1,说明两者之间有关联。
(8)McNemar复选框:进行McNemar检验(一种非参检验),两个二值变量相关性的非参数检验。该检验只有在行列数相等时才能用;
(9)Cochran’s and Mantel-Haenszel statistics复选框:进行独立性和齐性检验。
6-8 单击按钮弹出Cell子对话框,用于定义列联表单元格中需要计算的指标,如图4-9-4所示。
图4-9-4 Cell子对话框
Cell子对话框主要包括以下几部分:
Counts复选框:是否输出实际观察数( Observed)和期望数(Expected);
Percentages复选框:是否输出行百分数(Row)、列百分数(Column)以
及合计百分数(Total);
Residuals复选框:选择残差的显示方式,可以是实际数与期望数的差值(Unstandardized)、标化后的差值(standardized,将差值转化为标准正态分布),或者被标准误除的单元格残差();
Noninteger Weights:当频数因为加权而变成小数时,选择该项对频数进行取整。主要包括五种方法:Round cell counts:对频数进行四舍五入取整;Round case weights:对加权样本在使用前进行四舍五入取整;Truncate cell cou