1 / 12
文档名称:

医学统计学知识点梳理.docx

格式:docx   大小:436KB   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

医学统计学知识点梳理.docx

上传人:zyl 2023/2/6 文件大小:436 KB

下载得到文件列表

医学统计学知识点梳理.docx

文档介绍

文档介绍:该【医学统计学知识点梳理 】是由【zyl】上传分享,文档一共【12】页,该文档可以免费在线阅读,需要了解更多关于【医学统计学知识点梳理 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。Revisedat2pmonDecember25,2020.
医学统计学知识点梳理
医学统计学知识点梳理
医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。
统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。
统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:
①参数估计:用样本的指标去推断总体相应的指标
②假设检验:由样本的差异推断总体之间是否可能存在的差异
同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。
总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
随机抽样:随机抽样(randomsampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。
变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurementdata)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(countdata)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata)。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)=m/n。
随机误差(randomerror)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。
抽样误差(samplingerror)是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
系统误差:系统误差(systematicerror)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机变量:随机变量(randomvariable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
频数表(frequencytable)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
算术均数(arithmeticmean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。
几何均数(geometricmean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。
中位数(median)Md将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。
极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。
四分位数间距(inter-quartilerange)是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
变异系数(coefficientofvariation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示。计算:标准差/均数*100%
统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statisticalinference)。
抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(samplingerror)。
标准误及Xs:通常将样本统计量的标准差称为标准误(standarderrorofmean,SEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidenceinterval,CI)。
参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
I?型错误(typeIerror),指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α表示。
II?型错误(typeIIerror),指接受了实际上不成立的H0,这类“存伪”的误称为II型错误,其概率大小用β表示。
检验效能:1-β称为检验效能(poweroftest),它是指当两总体确有差别,按规定的检验水准a所能发现该差异的能力。
率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。
计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(‰)等。
构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。
比(ratio)又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几。
计算公式为:A/B,表示方式有:倍数或分数等。
非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。
参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametricstatistics)
秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。
秩和:各组秩次的合计称为秩和(ranksum),是非参数检验的基本统计量。
直线回归(linearregression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simpleregression)。
回归系数(regressioncoefficient)即直线的斜率(slope),在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位。
相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。
二相关概念
医学科研数据统计分析大致分以下4个步骤。
数据整理
统计描述
统计推断
结果表达
频数表的制作
求全距R
找到资料中的最大值A和最小值B
计算全距R,
划分组段
确定组数
确定组距
确定各组段的上下限
下限(lowerlimit)上限(upperlimit)
第一组段,其下限可取小于最小观察值得数
半开半闭区间[--,--)
画表
频数分布表和频数分布图的用途
揭示频数分布的特征
集中趋势
集中趋势是指一组数据向某一个位置聚集或集中的倾向。
离散趋势
离散趋势反映的是一组数据的分散性和变异度,即各个数据离开集中位置的程度。
便于观察数据的分布类型
正态分布?
集中趋势的指标:均数
离散趋势的指标:标准差
偏态分布
集中趋势的指标:中位数
离散趋势的指标:四分位间距
算术平均数
几何平均数
中位数
符号
X
G
M
含义
各观察值相加除以观察值的个数所得之商。
N各观察值的乘积开n次方所得之根
一组观察值按顺序排列,居中者。
应用条件
正态或近似正态分布
对数正态分布
极偏态或分布不清的资料
计算公式
说明
加权法计算中X值的含义
中位数为百分位数的特例
标准差的意义和用途
说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差.
标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。
用于计算变异系数
用于计算标准误
结合均值与正态分布的规律,估计参考值的范围。
变异系数(coefficientofvariation)
适用范围
1观察指标单位不同,如身高、体重——不同单位资料
2均数相差悬殊
变异系数的特点及相应的用途
没有单位
n反映标准差占均数的百分比或标准差是均数的几倍
n可用来比较度量衡单位不同的资料的变异度
不受平均水平的影响
n反映的是以均数为基数的相对变异的大小
n比较均数相差悬殊的资料的变异度
变异指标小结
,适合于任何分布
,最常用,适合于近似正态分布

,常配套使用如——正态分布:均数、标准差;偏态分布:中位数、四分位间距
相对数使用应注意的问题
,常见错误是以构成比代率。
。分母小于20时可靠性较差。如果分母太小,宜用绝对数表示。
,不能将几个率直接相加求平均率。
。若内部构成不同的资料,应先进行率的标准化后再比。
,要考虑抽样误差的影响。
中心极限定理centrallimittheorem
①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。
②随着样本量的增大,样本均数的变异范围也逐渐变窄。
标准误
标准误越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之亦然。
标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异。
标准误与标准差成正比,当总体中各观测值变异很小时,样本均数与总体均数的差异小,抽样误差小。
标准误与样本含量的平方根成反比,样本含量越大,抽样误差越小
t分布
同一概率下,自由度越大,|t|越小;
同一自由度下,|t|越大,概率P值越小;
同一自由度下,双侧概率为单侧概率的2倍时,所对应的t界值相等;
当自由度趋向于∞时的t界值即为相应概率下的Z值。
统计推断的任务就是用样本信息推论总体特征。
1、点(值)估计——(近似值)——用相应的样本统计量直接作为其总体参数的估计值。
2、区间估计——(近似范围)——按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围
区别点
总体均数可信区间
参考值范围


按预先给定的概率,确定未知参数m的可能范围。实际上,一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:当a=时,95%CI估计正确的概率为,估计错误的概率小于或等于,即有95%的可能性包含了总体均数。
“正常人”的解剖,生理,生化某项指标的波动范围。
总体均数的波动范围
个体值的波动范围
计算
公式
s未知n较小:
s已知,
或s未知但n>60:
正态分布:**
偏态分布:PX~P100-X
用途
总体均数的区间估计
绝大多数(如95%)观察对象某项指标的分布范围
假设检验有三个基本步骤:
①建立假设和确定检验水准,通常选α=
②计算检验统计量
③确定P?值和做出统计推断结论?
所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第②步计算的检验统计量不同。
H0和H1的涵义及注意事项?
,而非样本;
和H1是互相对立,不是可有可无,而是缺一不可;
,通常是某两个或多个总体参数相相同,或总体参数之差为0,或某资料服从某一分布等等;
,当H0被拒绝时,则接受H1
,即它通常是被认为可能比零假设更符合数据所代表的现实。H1的内容反映出单侧还是双侧
即H1成立
客观实际
假设检验的结果
拒绝H0
不拒绝H0
H0成立
I型错误(a)
推断正确(1-a)
H0不成立
推断正确(1-b)
II型错误(b)
减少I型错误的主要方法:假设检验时设定a?值。
减少II型错误的主要方法:提高检验效能。
方差分析应用条件:
总体——正态且方差相等
样本——独立、随机
方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较
卡方检验目的:
推断两个总体率或构成比之间有无差别
多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
应用:计数资料
检验统计量2值反映了实际频数与理论频数的吻合程度。自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,v=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。
参数统计(parametricstatistics):
总体分布型已知,对总体参数进行估计或检验
正态分布、二项分布、泊松分布等的检验
不可用参数检验的情形:
不符合正态分布要求或方差齐性要求
变量变换后方差仍不齐或非正态分布
总体分布未知
需找到不依赖于总体分布的方法
应用非参数检验的情况:


(如<、
>65等)的资料(必选)
(双向)有序列联表资料

双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值
(X1,Y1),(X2,Y2),…,(Xn,Yn)
目的:研究X和Y的数量关系
方法:相关与回归——简单、基本:直线相关、直线回归

最近更新

房地产经纪人之业务操作题库附答案(满分必刷.. 42页

房地产经纪人之业务操作题库大全(全国通用).. 41页

房地产经纪人之业务操作题库大全含答案解析 41页

房地产经纪人之业务操作附答案(典型题) 41页

内科症状学 119页

房地产经纪人之业务操作精选题库及完整答案 41页

内科护理学《第九章神经系统疾病患者的护理》.. 43页

房地产经纪人之业务操作完整题库带答案(轻巧.. 42页

房地产经纪人之业务操作完整题库【实用】 42页

房地产经纪人之业务操作完整版精品加答案 42页

荧光绿科技动感工作汇报商务通用PPT模板 30页

房地产经纪人之业务操作大全精品加答案 41页

房地产经纪人之业务操作大全1套 42页

房地产经纪人之业务操作及参考答案(精练) 41页

房地产经纪人之业务操作包过题库有精品答案 41页

房地产经纪人之业务操作包过题库【研优卷】 41页

房地产经纪人之业务操作内部题库含答案(新).. 42页

2023年医院互联网+陪诊服务理论考核试题及答案.. 13页

呼吸内科一科一品优质护理汇报 30页

东北大学自主招生个人陈述自荐信 3页

心电图机的使用与维护课件 40页

劳动最光荣剧本 5页

起毛机参数选择对织物起毛的影响 4页

hec-ras中文入门级 10页

二十四山各度数 10页

华北电力大学电机实验报告 6页

彼得后书第一章注释(陈本伟).doc 14页