文档介绍:该【医学统计学总结计划 】是由【泰山小桥流水】上传分享,文档一共【20】页,该文档可以免费在线阅读,需要了解更多关于【医学统计学总结计划 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。精选文档
精选文档
精选文档
医学学
一.
1,医学学:运用概率和数理学的原理和方法,研究医学域中随机象有关数据的采集、整理、剖析和推测,而明其客律性的一用科学。
2,医学学的主要内容:
1)研究研究和研究
2)医学学的基根源理和方法研究和数据理中的基本理和方法。A:料的采集与
整理B:常用描绘,集中和失散,相数,有关系数,回系数,表,C:
推测,如参数估和假。
3)医学多元方法多元性回和逐渐回剖析、判剖析、聚剖析、主成分剖析、因子剖析、
logistic回与Cox回剖析。
3,工作步:
1)明确研究目的和研究假,确立察象与察位,本含量和抽方法,定研究方案,
期剖析指,差控制举措,度与用。
2)采集资料
A,采集资料的原及、正确、完好
B,料的根源医学域的料的根源主要有三个方面。一是表,二是常性工
作,三是或。
C,料存
3)整理料a核b分c定整理表d表
4)剖析料剖析包含描绘和推测
4,同(homogeneity):指被研究指的影响要素相同。
异(variation):同基上的各察位的差异。
量(variable):采集料程中,依据研究目确实定同察位,再每个察位的某特点行量或察,种特点称量
量:量的察果或量。
量型
量表
例
料型
数目
失散型
上次数
定量量,有量位
量料
型
身高
分
无
二分
立的两属性
性(男女)
序
多分
不相容的多属性
血型(A,B,O,AB)
数料
量
有
多分
有程度差异的属性
受教育程度(小学,中
序
学,高中,大学⋯)
等料
5,体(population)依据研究目的所确立的同研究象中全部察位某量的会合。体拥有的基本特点是:同性
本(sample)从体中随机抽取部分察位,其量的会合构成本。本必拥有代表性。代表性是指本来自同体,足的本含量和随机抽的前提。
量(statistics)描绘本量特点的指(本率,本均数,本准差)。
精选文档
精选文档
精选文档
参数(parameter)描绘整体变量值特点的指标(整体率,标准差,整体均数)。
抽样偏差(samplingerror):因为个体差异的存在,即便在同一整体中随机抽取若干样本,各种本的统计量常常不等,统计量与参数也会有所不同。这种因抽样研究惹起的差异称抽样偏差。
随机事件(randomevent)对随机试验的各种可能结果的会合。
概率(probability)描绘随机事件发生的可能性大些哦的一个胸怀。
小概率事件若随机事件A的概率P(A)≤α,习惯上,α=,就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中以为不会发生。
抽样偏差
1,抽样偏差(samplingerror)由抽样而造成的样本统计量与整体参数之间的差异或各种本统计量之间的
差异。在医学统计学中,常把由抽样造成的样本均数与整体均数间的差异称为均数的抽样偏差;由抽样造
成的样本率与整体率之间的差异称为率的抽样偏差。
2,样本均数的标准差(简称标准误,standarderror)反应均数的抽样偏差大小的指标。大,抽
样偏差大;反之,小,抽样偏差小。
)
实质工作中常常未知的,可用样本标准差s作的预计值,计算标准误的预计值。
)
3,标准误的用途:a,权衡样本均数的靠谱性;b,预计整体均数的置信区间;3,用于均数的假定查验。
4,标准误的预计值的用途:
,描绘抽样偏差的大小;
,整体参数的预计;
,用来进行假定查验。
5,率的抽样偏差:由抽样造成的样本率与整体率的差异称为率的抽样偏差。
权衡率的抽样偏差大小的指标是率的标准误。越小,率的抽样偏差越小;越大,率的抽样误
差越大。
)
此中为整体率。实质工作中,因为常常是未知的,可用样本率p作的预计值,计算率的标准误
精选文档
精选文档
精选文档
的预计值。
精选文档
精选文档
精选文档
)。
标准差(s)标准误
计算公式s=
(1
)表示察看值的变异程度
(1)预计均数的抽样偏差的大小
(2)预计整体均数的可信区间
(2)计算变异系数CV=
100%
(
,
)
(3
)确立医学参照值范围
(3)进行假定查验
(4
)计算标准误
简述标准差、标准误的差异与联系?
差异:(1)含义不同:标准差S表示察看值的变异程度,描绘个体变量值(x)之间的变异度大小,S越
大,变量值(x)越分别;反之变量值越集中,均数的代表性越强。标准误预计均数的抽样偏差的大小,
是描绘样本均数之间的变异度大小,标准误越大,样本均数与整体均数间差异越大,抽样偏差越大;反之,
样本均数越凑近整体均数,抽样偏差越小。(2)与n的关系不同:n增大时,S趋于σ(恒定),标准误
减少并趋于0(不存在抽样偏差)。(3)用途不同:标准差表示x的变异度大小、计算变异系数、确立医学参照值范围、计算标准误等,标准误用于预计整体均数可信区间和假定查验。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
标准差:标准误:
.散布
正态散布
,正态散布的函数
此中为整体均数,为整体标准差,为圆周率,为自然对数的底,且仅为变量。以为横轴,
以为纵轴,当均数和标准差已知时即可绘出正态散布曲线。
为应用方便,将式中进行变量变换,使本来的正态散布变成的标准正态散布,亦
称散布。被称为标准正态变量或标准正态离差,将代入上述公式即得标准正态散布的密度函数
精选文档
精选文档
精选文档
。
精选文档
精选文档
精选文档
()
()
,正态散布的特点
1)正态曲线(normalcurve)在横轴上方均数处最高。
2)正态散布以均数为中心,左右对称。
(3)正态散布有2个参数(parameter),即均数(地点)和标准差(形状)。当固定不变时,
越大,曲线沿横轴越向右挪动;反之,越小,则曲线沿横轴越向左挪动。当固定不变时,越
精选文档
精选文档
精选文档
大,曲线越平阔;
越小,曲线越尖峭。往常用
N(
,
)表示均数为
、方差为
的正态散布。
精选文档
精选文档
精选文档
用(0,1)表示标准正态散布。(
4)正态散布在
1处各有一个拐点。(
5)正态曲线下边积的散布有
精选文档
精选文档
精选文档
必定规律。
精选文档
精选文档
精选文档
3,常用的两个区间:
95%及99%。
精选文档
精选文档
精选文档
4,正态散布的应用
),拟订医学参照值范围
a,正态散布法合用于正态或近似正态散布的资料两侧界值:;单侧上界:,
或单侧下界:。
精选文档
精选文档
精选文档
b,对数正态散布法合用于对数正态散布资料两侧界值:
,或单侧下界
c,百分位数法常用于偏态散布资料及资猜中一端或两头无切实数值的资料。两侧界值:
;单侧上界:,或单侧下界:。
;单侧上界:
和
精选文档
精选文档
精选文档
2)正态散布是多种统计方法的理论基础
如t散布,F散布,
散布都是在正态散布的基础上推导出
精选文档
精选文档
精选文档
来的,散布也是以正态散布为基础的。此外
t散布,二项散布,
poisson散布的极限为正态散布,必定条
精选文档
精选文档
精选文档
件下可按正态散布原理办理。
t散布
精选文档
精选文档
精选文档
1,t散布:
()
散布的特点为:
,左右对称的单峰散布。
精选文档
精选文档
精选文档
2.
t散布曲线形态变化与自由度的大小有关。自由度
越小,则
t值越分别,曲线越低平;自
精选文档
精选文档
精选文档
由度
渐渐增大时,则
t散布渐渐迫近正态散布(标准正态散布)。当
=时,t散布为
精选文档
精选文档
精选文档
u散布。t界值表附图中非暗影部分面积的概率为:
精选文档
精选文档
精选文档
2,整体均数的预计:用样本指标预计整体参数称为参数预计,是统计推测的一个重要方面。整体均数的估
精选文档
精选文档
精选文档
计有
2种方法。一是直接用统计量
预计整体参数
,称为点值预计。因为抽样偏差的存在,此法很难
精选文档
精选文档
精选文档
预计正确。二是区间预计(intervalestimation)法。区间预计是按必定的概率
所在的范围,亦称可信区间(confidenceinterval,CI)。常取的可信度为
99%可信区间。计算方法有3种:
(1)未知且n小按t散布原理用式()计算可信区间。
100(1-)%预计整体均数
95%和99%,即95%可信区间和
精选文档
精选文档
精选文档
因为将代入,得
则整体均数的100(1-)%可信区间的通式为:()或写成
(
,
)。
(2)
未知,但n足够大时(n>100)t散布迫近u散布,按正态散布原理,用式(
)预计可信区间。
(
)()
(3)
已知按正态散布原理,用式(
)预计可信区间。
精选文档
精选文档
精选文档
(
)()
精选文档
精选文档
精选文档
标准正态散布(u散布)与t散布有何异同?
答:相同点:t散布和标准正态散布(u散布)都是以0为中心的正态散布。标准正态散布是t散布的特例
(自由度是无穷大时)。
精选文档
精选文档
精选文档
不同点:t散布为抽样散布,u散布为理论散布;t散布比标准正态散布的峰值低,且尾部翘得更高;t
散布受自由度大小的影响,跟着自由度的增大,渐渐趋近于标准正态散布;t散布有无数条曲线,而u散布
只有独一一条曲线。
二项散布
1,二项散布(binomialdistribution)是对只拥有2种互斥结果的失散型随机事件的规律性进行描绘的一种
概率散布。
精选文档
精选文档
精选文档
二项散布概率公式:
()
精选文档
精选文档
精选文档
式中n为独立的贝努力试验次数,
为成功的概率,(1-
)为失败的概率,
X为在
n次贝努力试验中出
精选文档
精选文档
精选文档
现“成功”的次数,表示在n次试验中出现X的各种组合数,在此称为二项系数(binomialcoefficient)。
2,二项散布的应用条件:
(1)各察看单位只好拥有互相对峙的一种结果,如阳性或阴性,生计或死亡。
(2)已知发生某一结果(阳性)的概率为,其对峙结果的概率为1-,实质工作中要求是从大
精选文档
精选文档
精选文档
量察看中获取比较稳固的数值。
(3)n次试验在相同条件下进行,且各个察看单位的察看结果互相独立。
3,二项散布的性质:
A,二项散布的均数和标准差在二项散布的资猜中,
当和n已知时,它的均数及其标准差以下:=n()
)
若均数和标准差不用绝对数表示,而是用率表示时,即对式()()分别除以n,得:
)
)
是样本率的标准误的理论值,当未知时,常用样本率p作为的预计值,则:
)
B,二项散布的累计概率二项散布的累计概率(cumulativeprobability)常用的有左边累计和右边累计2种
方法。
从阳性率为的整体中随机抽取n个个体,则
(1)最多有k例阳性的概率
()
精选文档
精选文档
精选文档
(2)最罕有
k例阳性的概率
精选文档
精选文档
精选文档
()
D,二项散布的形状取决于和n的大小:
精选文档
精选文档
精选文档
(1)当=,散布对称;当<,散布呈正偏态,且固定
n时,
越小,散布越偏;当
>
精选文档
精选文档
精选文档
时,散布呈负偏态,且固定n时,越大,散布越偏。
(2)对固定的,散布随n的增大趋于对称。
4,整体率的预计
精选文档
精选文档
精选文档
整体率的预计也有点预计和区间预计,的可能范围。样本率的理论散布和样本含量
点预计是简单地用样本率来预计整体率;
n、阳性率p的大小有关,因此需要依据
区间预计是求出整体率
n和p的大小不同,
精选文档
精选文档
精选文档
分别采纳以下
2种方法。
精选文档
精选文档
精选文档
(一)查表法
当样本含量
n较小,如
n≤50,特别是
p很凑近于
0或1时,按二项散布的原理预计整体率
精选文档
精选文档
精选文档
的可信区间。
精选文档
精选文档
精选文档
(二)正态近似法当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于
本率的p的抽样散布近似正态散布,整体率的可信区间可按以下式()进行预计。
5时,样
精选文档
精选文档
精选文档
()
Poisson散布
精选文档
精选文档
精选文档
1,Poisson散布泊松散布是在
很小,样本含量
n趋势于无量大时,二项散布的极限形式。更多地用于
精选文档
精选文档
精选文档
研究单位时间、单位人群、单位空间内,某稀有事件发生的次数的散布。
精选文档
精选文档
精选文档
X=0,1,2
()
精选文档
精选文档
精选文档
式中
=n
为Poisson散布的整体均数,
X为单位时间或单位空间内某事件的发生数,
e为自然对数的底,
精选文档
精选文档
精选文档
约等于
。在实质运算中,
P(X)亦可按式(
)作递推计算。
精选文档
精选文档
精选文档
()
2,Poisson散布应用条件:
A,要求事件的发生是互相独立
B,发生的概率相等
C,结果是二分类
3,Poisson散布的性质:
精选文档
精选文档
精选文档
A,该散布是一种单参数的失散型散布,其参数为
次数,又称强度参数。
,它表示单位时间或空间内某件事均匀发生的
精选文档
精选文档
精选文档
B,Poisson散布的方差
和均数
相等,即
=
精选文档
精选文档
精选文档
C,Poisson散布的累计概率
精选文档
精选文档
精选文档
(1)最多为k次的概率
(2)最少为k次的概率
4,Poisson散布的图形
精选文档
精选文档
精选文档
已知,便可按公式计算得出
X=0,1,2,
时的
P(X)值,以
X为横坐标,以
P(X)为纵坐标作图,
精选文档
精选文档
精选文档
即可会出Poisson散布的图形。
精选文档
精选文档
精选文档
值越小,散布越偏,跟着
的增大,散布越趋于对称,当
=20时,散布凑近正态散布,当
=50时,
精选文档
精选文档
精选文档
能够以为Poisson散布呈正态散布
N(
,)按正态散布办理。
精选文档
精选文档
精选文档
5,Poisson散布拥有可加性
6,整体参数的预计
精选文档
精选文档
精选文档
由样本均数(样本计数)X预计整体均数也有点(值)预计和区间预计,区间预计的方法,需视样本
计数(样本均数)X的大小而定,X小时用查表法,X大时用正态近似法。
(一)查表法
当样本计数X时,用X值查附表poisson散布的可信区间,可得整体均数的95%或99%
可信区间。
(二)正态近似法
当样本计数X>50时,可用正态近似原理下边公式求整体均数的95%或99%可信区间
正态散布、二项式和泊松散布的关系:
二项散布(binomialdistribution):对只拥有两种互斥结果的失散型随机事件的规律性进行描绘的一种
概率散布。Poisson散布是在π很小,样本含量n趋于无量大时,二项散布的极限形式。当v=∞时,t散布
即为u散布,趋势正态散布。
可信区间与参照值范围的差异:
意义、计算公式和用途均不同。(1)参照值范围是指同质整体内包含百分之几十个体值的预计范围。而可
信区间是指在百分之几十的可信度预计的整体参数的所在范围。(2)相同的百分之几十,参照值范围是样
本范围,可信区间是指可信度范围,二者有着实质的不同。(3)从意义来看,95%参照值范围是指同质总
体内包含95%个体值的预计范围,而整体均数95%可信区间是指按95%可信度预计的整体均数的所在范
精选文档
精选文档
精选文档
围。(4)从计算公式看,若指标听从正态散布,
95%参照值范围的公式是:
±。整体均数
95%可
精选文档
精选文档
精选文档
信区间的公式是:。前者用标准差,后者用标准误。,,
自由度为v的t界值。(5)从用途上看,可信区间用来预计整体均数,参照值范围用来判断察看对象的某
项指标能否正常。
简述查验假定与可信区间的联系与差异。
答:(1)可信区间用于推测整体参数所在的范围,假定查验用于推测整体参数能否不同。前者预计整体参
数的大小,后者推测整体参数有无质的不同。(2)可信区间也可回答假定查验的问题。但可信区间不可以提
精选文档
精选文档
精选文档
供切实的P值范围,只好给出在α水平上有无统计意义。(3)可信区间还可提示差异有无实质意义。
统计图表
1,绘制统计图的基本要求:
A,依据资料性质和剖析目的据顶适合图形。
B,标题应说明资料的内容、时间和地址,一般位于图的下方。
C,图的纵、横轴应注明标目及对应单位,尺度应等距或拥有规律性,一般自左而右、自下而上、由
小到大。
D,为使图形雅观并便于比较,统计图的长宽比率一般为7:5,有时为了说明问题也能够改动。
E,比较、说明不同的事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。
2,常用统计图的合用条件与绘制
精选文档
精选文档
精选文档
(bargraph)用等宽长条的高度表示按性质分类资料各种其余数值大小,用于表示它们之
间的对照关系。
(piegraph)圆形图合用于百分构成比资料,表示事物各构成部分所占的比重或构成。
(percentbar)意义及合用资料同圆图,也称构成条图。
(linegraph)线图合用于连续性资料,以不同的线段起落来表示资料的变化,并可表示一
事物随另一食品(时间)而改动的状况。
(histogram)直方图用于表达连续性资料的频数散布。
(scatterdiagram)散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系。
常用在对资料进行有关剖析以前合用。
单变量资料
一,数值变量
统计描绘
1,频数表的编制求全距定组段和组距列频数表画频数图
2,频数散布的两个重要特点:集中趋势和失散趋势
3,频数散布能够分为正态散布和偏态散布
4,频数表的用途:揭露资料散布种类和散布特点,以便选用适合的统计方法;便于进一步计算指标和统计
办理;便于发现某些特大或许特小的可疑值。
5,集中趋势的描绘:均数几何均数中位数百分位数
6,均数(mean):算术均数的简称。常用==表示。
7,中位数(median):一组由小到大按次序摆列的察看值中位次居中的数值,用M表示。可用于描绘任何分
布,特别是偏态散布资料以及频数散布的一端或两头无切实数据资料的中心地点。
8,百分位数(percentile)是一种地点指标,用表示。一个百分位数P将一组察看值分为两部分,理论
上有x%的察看值比它小,有(100-x)%的察看值比它大。可用于确立非正态散布资料的医学参照值范围。
9,失散趋势的描绘:全距(range)四分位数间距(quartile)方差标准差
10,全距(range)亦称极差,为一组同质察看值中最大值和最小值之差。反应个体差异的范围,长处是
计算简单,弊端是:1)只考虑最大最小值之间的差异,不可以反应组内其余察看值的变异度;2)样本含量
相差悬殊时不宜用全距比较。
11,四分位数间距(quartile)上四分位数与下四分位数之差。常用于描绘偏态频数散布以及散布的一端或两头无切实数值资料的失散程度。
12,方差(variance)离均差的平方和表示。
13,标准差(standardvariance)的作用:a,预计变量值的失散程度b,计算变异系数c,与均数联合,估
计变异值的频数散布范围d,计算标准误
精选文档
精选文档
精选文档
(整体)s=(样本)
精选文档
精选文档
精选文档
14,变异系数(coefficientofvariation)常用于比较胸怀单位不同或均数相差悬殊的两组或多组资料的变异
度。CV=
100%
假定查验
1,假定查验(hypothesistest)亦称明显性查验(significancetest),其基本思想是先对整体的参数或散布
做出某种假定,如设整体均数(或率)为必定值;两整体均数(或率)相等;整体听从正态散布或两散布
相同样,而后依据样本信息采纳适合的方法,推测此假定应当拒绝或不拒绝。
2,假定查验的一般步骤:
1)成立假定和确立查验水平:依据实质状况确立单、两侧查验,成立假定,确立查验水平;
2)选定查验方法和计算统计量:依据设计的种类及研究目的选择适合的查验方法并计算出对应的统计量;
(3)确立P值并做出推测结论。若t≥tα,v,则P≤α,按查验水平,拒绝H0,接受H1,尚可以为差异
明显有统计学意义;相反则差异不明显,无统计学意义
3,假定查验时应注意的事项:
1)要有严实的抽样研究设计;样本一定是从同质整体中随机抽取的,要保证组间的平衡性和资料的可比性,可能影响结果的非办理要素在对照组间应尽可能相同或邻近;
2)正确选择查验方法;依据现有的资料种类、设计种类、剖析目的、样本含量等要素采纳适合的查验方法,如不切合条件可做适合变换;
3)正确理解“差异无明显性”的含义,差异有统计学意义,不可以理解为二者差差大,也不可以理解为所剖析的指标在实质应用上就有“明显成效”。
4)查验假定的推测结论为概率结论,不可以绝对化:查验水平人为规定,是相对的,报告结论时应列出查验统计量和P值确实切范围。
5)注意是单侧查验仍是两侧查验
I型错误和II型错误:
I型错误(typeIerror)拒绝了实质上成立的,即样根源本来自的整体,因为抽样的有时
性获取了较大的t值,因此拒绝了,接受了,这种弃真错误称为第一类错误,犯第一类错误的概率
是。
II型错误(typeIIerror)是不拒绝实质上不可立的,即“存伪”即样根源本来自的整体,
可是因为抽样的有时性,获取了较小的t值,获取了较大的P值,没有拒绝,这种存伪错误称为第二
类错误,犯第二类错误的概率是1-
正态性查验:用均数和标准差描绘资料的散布特点,对例数n较小的样本进行t查验时,第一要求样本取
自正态散布的整体。
两个方差的齐性查验:两样本均数比较的t查验和多个样本均数比较的方差剖析要求各种本所来自的整体方差相等。两样本方差的齐性查验:
精选文档
精选文档
精选文档
)
精选文档
精选文档
精选文档