1 / 20
文档名称:

独立性检验.pptx

格式:pptx   大小:1,566KB   页数:20页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

独立性检验.pptx

上传人:cai.li.bin 2020/4/4 文件大小:1.53 MB

下载得到文件列表

独立性检验.pptx

文档介绍

文档介绍:×,×:以下两组变量在取不同的值时的区别(1)体重、身高、学生的学****成绩(2)性别、国籍、宗教信仰、是否吸烟、是否患病答:1中每个变量取不同“值”时,表示不同个体,2中变量每取不同“值”表示个体所属不同的类别问题2:吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?本节课就是要学****独立性检验思想在分析分类变量之间关系中的应用。1分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。问题引入为调查吸烟是否对患肺有影响,某种瘤研究所随机地调查了9965人,得到如下结果(单位:人)表3-7吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对患肺癌有影响?像表3-7这样列出的两个分类变量的频数表,称为列联表。结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。:吸烟更容易引发肺癌y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:(1)定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.(2)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(3)观察等高条形图发现相差很大,-9吸烟与肺癌联列表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d结论是否可靠?假设H0:吸烟与患肺癌没有关系用A表示不吸烟,用B表示不患肺癌,则H等价于吸烟与患肺癌独立P(AB)=P(A)P(B),作用:检验两个变量是否有关系利用随机变量来判断两个分类变量有关系的方法。独立检验步骤:(1)列出2X2列联表(3)查对临界值,作出判断。(2)计算的观测值k;卡方临界值表:(K2≥k0)k0如果,就以的把握认为X与Y有系”;而这种判断有可能出错,出错的概率不超过。K2的观测值为k独立性检验定义: