1 / 9
文档名称:

交叉表分析.doc

格式:doc   页数:9页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

交叉表分析.doc

上传人:fy3986758 2016/6/15 文件大小:0 KB

下载得到文件列表

交叉表分析.doc

相关文档

文档介绍

文档介绍:进行交叉表分析时需要注意: (1) 卡方检验要求各单元的期望频数均大于 5 或小于 5 的比例不能超过 20% ; 当样本数小于40时, 需要进行小样本的交叉表分析。即选择输出结果中的 Fishe r 精确检验结果( Fisher's Exact Test ) (2 )若变量为定距以上的变量需要先转化为定类或定序变量 data05-02 为某公司工资数据( n=15 )。使用变量性别 sex 、收入高低 earnings 分析男女经理间薪金是否平等。可以利用 data05-01 中的数据, 使用变量 at80 为工作性质分类, region 为地区, child s 为每个家庭的孩子数。将 child s 为行变量, at8 0 为列变量, regio n 为控制变量选入 Layer of 框中,进行交叉表分析。列联表(交叉表)分析 1、项目名称 Crosstabs 过程 4 、实训原理 Crosstabs 过程用于定类数据和定序数据进行统计描述和简单的统计推断。在分析时可以产生二维至 n维列联表,并计算相应的百分数指标。 4-1 列联表分析的含义与任务在实际分析中,当问题涉及到多个变量时,我们不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。很明显,如果还采用单纯的频数分析方法显然不能满足要求。因此,我们需要借助交叉分组下的频数分析,即列联表分析。列联表分析的主要任务有两个: (1 )根据样本数据产生二维或多维交叉列联表。交叉列联表是两个或两个以上变量交叉分组后形成的频数分布表。(2 )在交叉列联表的基础上,分析两变量之间是否具有独立性或一定的相关性。 4-2 卡方检验的原理为了理解列联表中行变量( Row )和列变量( Column )之间的关系,我们需要借助非参数检验方法。通常采用的方法是卡方检验。和一般假设检验一样, 卡方检验主要包括三个步骤: (1)建立零假设:行变量和列变量相互独立。(2 )选择和计算检验统计量。列联表分析中的检验统计量是 Pearson 卡方统计量。其公式为: ???????? ri cj e ij e ij o ijf ff 11 22?( 4-9-1 ) 其中,r为列联表的行数,c为列联表的列数, 0f 为实际观测频数, ef 期望观测频数。期望频数的计算公式为: n CT RT f e??( 4-9-2 ) 其中, RT 是指定单元格所在行的观测频数合计, CT 是指定单元格所在列的观测频数合计, n是观测频数的合计。由式( 4-9-1 )可以看出,卡方统计量的大小取决于两个因素:一个是列联表的格子数;另一个是观测频数和期望频数的差值。在列联表固定的情况下,卡方统计量取值的大小取决于观测频数和期望频数的总差值。当总差值越大时,卡方值也就越大,表明行列变量之间越相关;反之,当总差值越小时,卡方值也就越小,表明行列变量之间越独立。(3 )得出结论并做决策。根据卡方统计量的概率 P 值和显著性水平?进行比较,做出拒绝还是接受原假设的结论。如果卡方检验的概率 P值小于显著性水平?,则拒绝原假设,认为行列变量之间不独立,两者之间存在依存关系。反之, 如果卡方检验的概率 P值大于显著性水平?,则接受原假设,认为行列变量之间独立,两者之间不存在依存关系。在