文档介绍:3. 1 独立性检验问题: 数学家庞加莱每天都从一家面包店买一块 1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现, 所记录数据的均值为 950g 。于是庞加莱推断这家面包店的面包分量不足。?假设“面包份量足”,则一年购买面包的质量数据的平均值应该不少于 1000g ; ?“这个平均值不大于 950g ”是一个与假设“面包份量足”矛盾的小概率事件; ?这个小概率事件的发生使庞加莱得出推断结果。一:假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用 H 0 表示;另一个叫做备择假设,用 H 1表示。例如,在前面的例子中, 原假设为: H 0:面包份量足, 备择假设为: H 1:面包份量不足。这个假设检验问题可以表达为: H 0:面包份量足←→ H 1:面包份量不足二:求解假设检验问题考虑假设检验问题: H 0:面包分量足←→ H 1:面包分量不足 0成立的条件下,构造与 H 0矛盾的小概率事件; ,就能以一定把握断言 H 1成立;否则,断言没有发现样本数据与 H 0相矛盾的证据。求解思路分析: 本节研究的是两个分类变量的独立性检验问题。????? 2 定量变量——回归分析(画散点图、相关系数r、变量 相关指数R 、残差分析) 分类变量——研究两个变量的相关关系: ?????定量变量:体重、身高、温度、考试成绩等等。变量分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等。两种变量:独立性检验在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。,进行了一次抽样调查, 共调查了 339 名50岁以上的人,其中吸烟者205 人,不吸烟者 134 : 吸烟的 205 人中有 43人患呼吸道疾病(简称患病), 162 人未患呼吸道疾病(简称未患病);不吸烟的 134 人中有 13人患病, 121 :根据这些数据能否断定“患慢性支气管炎与吸烟有关”? (1)为了研究这个问题,将上述数据用下表来表示: 339 283 56 合计 134 121 13 不吸烟 205 162 43 吸烟合计未患病患病(2)估计吸烟者与不吸烟者患病的可能性差异: 在吸烟的人中,有的人患病, 43 % 205 ?在不吸烟的人中,有的人患病. 13 % 134 ?问题:由上述结论能否得出患病与吸烟有关?把握有多大? (1)假设:患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下列 2×2列联表: BA 不吸烟(n n +2 n +1 合计 n 2+ n 22 n 21 不吸烟 n 1+ n 12 n 11 吸烟 A 合计未患病( ) 患病( B) A B即n 11(n 21+n 22)≈n 21(n 11+n 12)?n 11n 22- n 21n 12≈0,因此, |n 11n 22-n 21n 12|越小, 患病与吸烟之间的关系越弱,否则,关系越强. 近似的判断方法: 设n=n 11+n 21+n 12+n 22,如果 H 0成立,则在吸烟的人中患病的比例与不吸烟的人中患病的比例应差不多,由此可得, 11 21 11 12 21 22 n n n n n n ?? ?上面的话的意思是指事件 A与B独立, 这时应该有 P( AB )=P(A)P(B)成立, 我们用 H 0表示上式,即 H 0:P( AB )=P(A ) P(B ). 并称之为统计假设,当 H 0成立时, 下面的三个式子也成立: ( ) ( ) ( ) P AB P A P B ?( ) ( ) ( ) P AB P A P B ?( ) ( ) ( ) P AB P A P B ?