1 / 15
文档名称:

多因素分析.doc

格式:doc   页数:15页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多因素分析.doc

上传人:分享精品 2016/3/2 文件大小:0 KB

下载得到文件列表

多因素分析.doc

相关文档

文档介绍

文档介绍:多因素分析研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括:多元线性回归(multiplelinearregression)判别分析(disoriminantanalysis)聚类分析(clusteranalysis)主成分分析(ponentanalysis)因子分析(factoranalysis)典型相关(canonicalcorrelation)logistic回归(logisticregression)Cox回归(COXregression)1、多元回归分析(multiplelinearregression)回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。全模型法其数学模型为:??????????ppxxxy?22110式中y为因变量,pxxx?21,为p个自变量,0?为常数项,p????21,为待定参数,称为偏回归系数(partialregressioncoefficient)。p????21,表示在其它自变量固定不变的情况下,自变量Xi每改变一个单位时,单独引起因变量Y的平均改变量。?为随机误差,又称残差(residual),它是在Y的变化中不能为自变量所解释的部分例如:1、现有20名糖尿病病人的血糖(Lmmoly/,)、胰岛素(LmUx/,1)及生长素(Lgx/,2?)的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。逐步回归分析(stepwiseregressionanalysis)在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。有些研究者对所要研究的指标仅具有初步知识,并不知道哪些指标会有显著性作用,只想从众多的变量中,挑选出对因变量有显著性意义的因素。一个较理想的回归方程,应包括所有对因变量作用有统计学意义的自变量,而不包括作用无统计学意义的自变量。建立这样一个回归方程较理想的方法之一是逐步回归分析(stepwiseregressionanalysis)基本原理:按这个自变量在方程中对因变量作用的大小,由大到小依次引入方程。每引入一个自变量都要对回归方程中每一个已引入的(包括刚被引入的)自变量的作用作统计意义检验,若发现一个或几个已被引入的自变量的作用无统计学意义时,即行剔除。每剔除一个自变量后,也要对留在回归方程中的自变量逐个作统计学意义检验。如果发现方程中还存在作用无统计学意义的自变量时,也予以剔除,直至没有自变量可引入,也没有自变量可从方程中剔除为止。最优方程应是:????????ppxxy?110对y有显著性作用的自变量全部到回归方程中。凡是对y没有显著性作用的自变量都不被引入方程。例如:1、讨论中学生的肺活量的影响因素,观察了10名女中学生的体重(X1,kg)、胸围(X2,cm)、胸围之呼吸差(X3,cm)及肺活量(Y,ml)。2、某研究协作组调查煤矿工人II期高血压患者40例,同时调查了工作面的污染程度(X1)、井下工作时间(X2)、每人的体重(X3)、吸烟年限(X4)、饮酒年限(X5)和收缩压(y),欲分析影响煤矿工人II期高血压患者收缩压高低的主要因素。3、为探讨影响差等生学****成绩的因素,某儿科医生调查了某学校六年级各班倒数第五名以内学生的平均成绩(y),并测定了智商(X1)、血清铁(X2)、血清***(X3)、日均热卡(X4)、日均食入蛋白量(X5)、头围(X6)和月人均收入(X7)2、判别分析(discriminantanalysis)根据已掌握的一批分类明确的样品,制定出一个分类标准用以判断以后新样品的归类。在医学研究中经常遇到根据某病人的各种症状、体征、化验结果等来判定病人患的什么疾病,如:根据骨科的X光片的各种特征判断病人属于何种骨瘤?体育选材中根据运动员的体形、运动成绩、生理指标、心理素质指标、遗传因素判断是否选入运动队继续培养等。判别分析在医学领域的主要用途是:1、疾病诊断:用判别分析的方法诊断疾病又称为计量诊断。包括临床诊断、X线诊断、心电图诊断、超声波诊断、脑电图诊断等。2、疾病预报:流行病预报、某些疾病(心肌梗死、中风)的早期预报。3、预后估计:某些疗法的疗效估计,某些恶性肿瘤患者的生存期估计等。4、疾病的病因学估计:研究引起疾病的原因,并分析其主要影响因素。判别分析:要求Y变量二分类或多分类的属性变量。分别用Fisher和Bayes准则进行计算。同时根据样本中个体的症状、体征选用多元逐步判别分析的方法,来判断病人患的什么疾病。其判别函数为