文档介绍:2 / 17
卫生统计学复
概述
1、卫生统计学的概念〔熟练掌握〕
统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。
卫生统计学是应用数统括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间围的限制,因而观察单位数无限,该总体为无限总体。
在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。样本是按照随机化原如此,从总体中抽取的有代表性的局部观察单位的变量值的集合。如从上例的有限总体〔省2002年7岁健康男孩〕中,按照随机化原如此抽取100名7岁健康男孩,他们的身高值即为样本。从总体中抽取样本的过程为抽样,抽样方法有多种。抽样研究的目的是用样本信息推断总体特征。
统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数〔亦称样本含量〕恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。
3〕、资料与变量与其分类
总体确定之后,研究者应对每个观察单位的某项特征进展测量或观察,特征称为变量。如“身高〞、“体重〞、“性别〞、“血型〞、“疗效〞等。变量的测定值或观察值称为变量值或观察值,亦称为资料。
按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先要分清变量类型。
3 / 17
1〕数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高〔cm〕、体重〔kg〕、血压〔mmHg kPa〕、脉搏〔次/min〕和白细胞计数〔×10 9 /L〕等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。
2〕分类变量:其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类:
〔1〕无序分类变量是指所分类别或属性之间无程度和顺序的差异。它又可分为①二项分类,如性别〔男、女〕,药物反响〔阴性和阳性〕等;②多项分类,如血型〔O、A、B、AB〕,职业〔工、农、商、学、兵〕等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。
〔2〕有序分类变量各类别之间有程度的差异。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量〔各等级〕的频数表,所得资料称为等级资料。
变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进展转化。例如血红蛋白量〔g/L〕原属数值变量,假如按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;假如按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反响以0、1、2、3表示,如此可按数值变量资料〔定量资料〕分析。
4、随机事件与概率
医学研究的现象,大多数是随机现象,对随机现象进展实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。例如用一样治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后终究发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。
对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值,常用P表示。例如,投掷一枚均匀的硬币,随机事件A表示“正面向上〞,用 n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发生的频率〔f=m/n〕,0≤m≤n, 0≤f≤1。
用不同的投掷次数n作随机试验,结果如下:m/n=8/10=, 7/20=,…… , 249/500=, 501/1000=, 10001/2000=,由此看出当投掷次数n足够大时,f=m/n→,称P(A)=,或简写为:P=。当n足够大时,可以用f估计P。
随机事件概率的大小在0与1之间,即0<P<1,常用小数或百分数表示。P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。P=1表示事件必然发生,P=0表示事件不可能发生,它们是确定性的,