1 / 60
文档名称:

卡方.ppt

格式:ppt   页数:60页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

卡方.ppt

上传人:n22x33 2012/9/11 文件大小:0 KB

下载得到文件列表

卡方.ppt

文档介绍

文档介绍:χ2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个率或构成比间的比较,多个率或构成比间的比较,多个样本率比较的χ2分割,两个分类变量间有无关联性,拟合优度的χ2检验等。
第七章卡方检验
重点掌握:
;
;
×列表资料的卡方检验及应用中应注意的问题。
主要内容:
;
2. 四格表资料的卡方检验;
×列表资料的卡方检验;
;
;
;

χ2分布的特征: (1) χ2分布是一种连续型分布,其形状依赖于自由度ν的大小:当自由度ν≤2时,曲线呈L型;随着ν的增加,曲线逐渐趋于对称;当自由度ν∞时,χ2分布趋向正态分布。 (2) χ2分布具有可加性:如果两个独立的随机变量X1和X2分别服从自由度为ν1和ν2的χ2分布,则X1+X2服从自由度为(ν1+ν2)的χ2分布。 (3) χ2分布的分位数:当自由度ν确定后, χ2分布曲线下右侧尾部的面积为α时,横轴上相应的χ2值记作χ2α,ν即χ2分布的分位数。
0
2
4
6
8
10





若干
2
x
分布的概率密度曲线
例7-1 某神经内科医师欲比较A、B两种药治疗脑血管栓塞病人的疗效,将病情、病程相近且满足试验入选标准的156例脑血管栓塞患者随机分为两组,结果见表7-1。问两药治疗近期有效率是否有差别?
表7-1 两药治疗脑血管病有效率比较
第一节卡方检验的基本思想
药物
有效
无效
合计
有效率(%)
A
73()
9()
82

B
52()
22()
74

合计
125
31
156


实际频数A (actual frequency) ( a、b、c、d)的
理论频数T( theoretical frequency)(H0:π1=π2=π):
a的理论频数=(a+b)×pc=(a+b)×[(a+c.)/ n]=nRnC/n=
b的理论频数=(a+b)×(1-pc)=(a+b)×[(b+d.)/ n]=nRnC/n=
c的理论频数=(c+d)×pc=(c+d)×[(a+c)/ n]=nRnC/n=
d的理论频数=(c+d)×(1-pc)=(c+d)×[(b+d.)/ n]=nRnC/n=

卡方检验的基本思想可以通过卡方检验的基本公式来理解。
从基本公式可以体会到卡方值反映了实际频数和理论频数吻合的程度。A与T相差越大,则(A-T)2的值越大,反之则越小。然而由(A-T)2的值来衡量实际频数与理论频数相差的程度,尚有不足之处。因为绝对差异值的大小还不能完全表示相差的程度,例如:某一资料的实际频数为386,理论频数为380,另一资料实际频数为20,理论频数为14,两者的(A-T)2均为36,然而前者为386例中仅差6,后者在20例中就差6,两者所占的比重极不相同。为弥补这一缺点,需把(A-T)2的值变为相对数,即把(A-T)2的值与相应的理论频数T值相比,即(A-T)2/T,以此来反映(A-T)2应占的比重。将每组的(A-T)2/T的值相加,即得基本公式。
(A-T)2为什么与理论频数T相比,而不是与实际频数A相比?其理由是:①当理论频数的数值极小时,由于抽样误差可使实际频数为零,所以不如用理论频数可靠;②理论频数是大量的经验和自然规律推算得来,而实际频数来自有限的样本,变动较大,所以用理论频数比较合理。
各种情形下,理论频数与实际频数偏离的总和即为卡
方值(chi-square value),它服从自由度为ν的卡
方分布。