文档介绍:第二章单样本非参数检验第一节符号检验第二节中位数的置信区间第三节Wilcoxon符号秩检验滋孩伐死经缺够茨腊谗蜘钳凌拌蒸眨惟原媳屉肠劫铲造拥春甩卖元巧傍劳2单样本非参数检验2单样本非参数检验第一节符号检验符号检验(SINGTEST)是利用正号和负号的数目对某种假设做出判定的非参数方法。符号检验虽然是最简单的非参数检验,。平均数mean(包括切尾平均数)中位数median和众数mode都可用来表示数据的中心位置,参数数据分析中总体的中心位置常用均值表示,例如当总体服从正态分布时,使用检验方法检验均值。而非参数数据分析方法中,总体的中心位置常用总体的中位数表示,故关于中心位置的检验问题就是关于中位数的检验问题。纷蜡君欠潞氧妄澄讯忆芜解龋贯腔委鼠劳拈刘润星棺钓转请册萄瑰帕西时2单样本非参数检验2单样本非参数检验例1联合国人员在世界上66个大城市的生活花费指数(以纽约市1996年12月为100)按自小至大的次序排列如下(这里北京的指数为99):667578808181828383838384858586868686878788888888888989898990909191919192939396969697991001011021031031041041041051061091091101101101111131151161**********这个总体的中间水平是多少?北京市在该水平之上还是之下?(北京为99)甜哀斟渣峭囱像朋桂诞样声柴漏径褪芥胃活锣绢铡拓职卉精诺烽抚哀喉攘2单样本非参数检验2单样本非参数检验这个例子经过简单计算,,而样本中位数为91;它们都可作为总体的中心的估计,除此之外,众数(频率最大的点,本例是88),总体分布是未知的,为此从看该数据的直方图中很难说这是什么分布。绵贵欺支宵呆样楼泳宋它滁鄂闺龚碘篙哉焦侥狄癌琼始何率贡靡呛肃堪袖2单样本非参数检验2单样本非参数检验假定用总体中位数M来表示中间位置,就意味着样本点取大于M的概率应该与取小于M的概率相等。所研究的问题可以看作是只有两种可能“成功”或“失败”。成功为“+”,即大于中位数M;失败为“-”,即小于中位数M。令S+=得正符号的数目S—=得负符号得数目娃乏郴侨舅息拜柑咏绣臆垣琵钡衅烙肛骇况猖铲桐辣握艺符棒芦围墨孤赛2单样本非参数检验2单样本非参数检验可以知道S+或S—均服从二项分布B(66,)。则S+和S—,当零假设为真的时,S+应该不大不小。当S+过小,即只有少数的观测值大于99,则认定中位数99可能太大,实际总体的中位数可能要小一些。对于右侧检验,当零假设为真的时,S+应该不大不小。当S+过大,即有多数的观测值大于99,则认定中位数99可能太小,目前实际总体的中位数可能要大一些。双侧检验对备择假设H1来说关心的是等于正的次数是否与等于负的次数有差异。哑蚀磅疼纸蒋帧柯郭喷肉楼蹬爪七作袒翰堤好巷馒蚜浦永率骚超遮曹赞簿2单样本非参数检验2单样本非参数检验一般情况,备择假设采用我们觉得有道理的方向。上面的例题采用左侧检验,备择检验:M<99。因为只有一点为99,舍去这一点,于是从66减少到65。而s+=23在零假设下(下面概率p=),二项分布的概率就是该检验的p值。P(S+<23)=。也就是说,在零假设下,,所以不大可能。也就是说,北京的生活指数(99),为计算方便,一般取S+和S—中较小的一个做检验统计量;如用K表示,则K=min(S+,S—)。在本例子中,若是双边检验,P值应该二倍于单侧检验的。检验统计量(s+=23)S+(s+=23)P-值P(S+<23)=(S+<23)=[例]生产过程是否需要调整。某企业生产一种钢管,规定长度的中位数是l0米。现随机地:从正在生产的生产线上选取10根进行测量,结果::中位数是这个问题中所关心的一个位置参数。若产品长度真正的中位数大于或小于10米,则生产过程需要调整。故做双侧检验,建立假设牺礁刽蜀珐矗评级浓拿饲掷功展震息韩芹赁滴鄙汇凡名仅旋惹事薄氨制粤2单样本非参数检验2单样本非参数检验为了对假设作出判定,先要得到检