文档介绍:运筹学与数据分析实践
数据分析部分
1
相关分析的基本概念
1
二元相关分析
2
偏相关分析
3
距离相关分析
4
相关分析
2
1 相关分析的基本概念
任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。
3
当一个变量x取一定值时,另一变量y可以按照确定的函数公式取一个确定的值,记为y = f(x),则称y是x的函数,也就时说y与x两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销售额=价格×销售量。
4
函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。
5
6
7
8
为了判断r对ρ的代表性大小,需要对相关系数进行假设检验。
(1)首先假设总体相关性为零,即H0为两总体无显著的线性相关关系。
(2)其次,计算相应的统计量,并得到对应的相伴概率值。如果相伴概率值小于或等于指定的显著性水平,则拒绝H0,认为两总体存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝H0,认为两总体不存在显著的线性相关关系。
9
相关系数的取值范围在−1和+1之间,即−1≤r≤+1。其中:
若0<r≤1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同;
若−1≤r<0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;
10