文档介绍:定量分析基本方法
——相关分析法
主要作用
研究和分析现象(变量)之间有无关系、相关的的密切程度、相关的方向和相关关系表现形式,不考虑因果关系。
适用条件
1 总体和样本:适用于样本
2 数据层级要求:定比数据
3 研究设计:横断面研究设计
4 样本大小: 根据研究对象的变化程度、精度要求、置信度、总体的大小和抽样的方法来综合确定
运算方法
相关系数r的计算:
:度量各个维度偏离其均值的程度,表示两列变量离差乘积的平均数,显示x与y之间相关的性质,即是正相关、负相关;显示x与y之间线性相关关系密切程度的大小。
:消除离差积乘中两个变量原有计量单位的影响;
将相关系数的值局限在-1到+1之间。
基本数据
Pearson(皮尔逊) 相关系数:也叫积差相关系数,对一般连续性、正态性数据适用。 
Spearman(斯皮尔曼)是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对分类变量的数据或变量值分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩--秩相关。
Kendall(肯德尔)相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。
运算工具—pss软件
第一步:绘制散点图
将相互关联的变量数据对(X,Y)作为二维平面的座标点,构建直角座标图,即散点图,以探究两变量间数量变化的趋势,为相关或回归分析提供初步的思路。
方法:Graphs→Interactives→ Scatterplot
第二步:相关分析
用相关系数(r)体现两个变量间的线性关系程度。
步骤:Analyze→Correlate→ Bivariate
结果分析
1、主要结论:计算相关系数r:利用样本数据计算样本相关系数,样本相关系数反映了两变量间线性相关程度的强弱。
2、指标解释
指标解释
相关系数的取值范围界于-1与1之间,即-1≤r≤1
1、当0<r ≤ 1,表明变量之间存在正相关关系;
2、当-1 ≤ r<0,表明变量之间存在负相关关系;
3、当|r|=1时,表示其中一个变量的取值完全取决于另一个变量,二者即为函数关系;
4、当r=0时,说明变量之间不存在线性相关关系,但这并不排除变量之间存在其它非线性相关的可能。
根据经验可将其相关程度分为几种:当|r|≥;≤|r|<; ≤|r|<;当|r|<。
相关分析与回归分析的联系和区别
联系:
(1)相关分析是回归分析的基础和前提。没有对现象间是否存在相关关系及密切程度作出判断,就不能进行回归分析。
(2)回归分析是相关分析的深入和继续。只有进行了回归分析,建立了回归方程,相关分析才有实际意义。
区别:
研究目的不同:相关分析研究变量之间相关的方向、相关程度和相关形式,而回归分析研究变量之间相互关系的具体形式,即当一个变量发生数量上的变化时,另一个变量平均会发生什么样的变化。
研究方法不同:相关分析是通过计算相关系数或相关指数来判断变量之间的相关关系,而回归分析是通过数学模型来确定变量之间的具体的数量关系。
变量的性质不同:在相关分析中,不用确定谁是自变量,谁是因变量,且所有变量都是随机变量。在回归分析中,必须事先确定在具有相关关系的变量中,谁是自变量和谁是因变量。一般来说,自变量是给定的非随机变量(一般变量),因变量是随机变量。