文档介绍:肃数学建模SPSS双变量相关性分析蝿蚄关键词:数学建模相关性分析SPSS蚃袀摘要:在数学建模中,相关性分析是很重要的一部分,尤其是在双变量分析时,要根据变量之间的联系建立评价指标,并且通过这些指标来进行比对赋值而做出评价结果。本文由数学建模中的双变量分析出发,首先阐述最主要的三种数据分析:Pearson系数,Spearman系数和Kendall系数的原理与应用,再由实际建模问题出发,阐述整个建模过程和结果。袇莇相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。蒃双变量相关分析中有三种数据分析:Pearson系数,Spearman系数和Kendall系数。羁Pearson相关系数用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数r。芀袇Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Spearman相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。膄设有n组观察对象,将Xi、Yi(i=1,2,…,n)分别由小到大编秩。并用Pi表示Xi的秩,Qi表示Yi的秩。蝿两者秩和为:莈Pi=Qi=n(n+1)2芆两者平均秩为:羄Pave=Qave=(n+1)2螀秩相关系数rs计算公式为:蒇rs=(Pi-Pave)(Qi-Qave)(Pi-Pave)2(Qi-Qave)2蚅下面以2013年“五一”大学生数学建模大赛为例:蚄要检验变量之间的相关性,利用SPSS进行双变量相关分析即可。因附录给出的数据存在许多错误,因此在进行分析前需要进行简单筛选。由于测量人数较多,直接在EXCEL中将测量数据为0或者过大的行全部删除即可。袂双变量相关分析中有三种数据分析:Pearson系数,Spearman系数和Kendall系数。为了确定合适的分析类型,我们需要利用SPSS对数据进行正态检验。衿通过观察发现,附录中给出的男女体质指标是不一样的,并且通过我们调查,男女体质数据的分布会有很大不同,因此在本问接下来的讨论中,我们把男女分开讨论。肅正太检验结果如下表,Sig>:蒅虿男生正态性检验羇薄Kolmogorov-Smirnova膅Shapiro-