文档介绍:相关性分析 Analysis of Correlation 第一节线性相关一、线性相关的概念线性相关(linear correlation) 又称简单相关(simple correlation) ,用于双变量正态分布(bivariate normal distribution) 资料。其性质可由散点图直观的说明。?目的:研究两个变量 X,Y 数量上的依存(或相关) 关系。?特点: 统计关系?相关性–如何测量两个变量之间的线性关系–如何解释皮尔森(Pearson) 相关系数, r 二、相关系数的意义与计算 :相关( correlation coefficient )又称 Pearson 积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。 2. 计算: 样本相关系数的计算公式为 2 2 ( )( ) ( ) ( ) XY XX YY X X Y Y l r l l X X Y Y ? ?? ?? ??? ?( 11-3 ) 相关系数的特点 r的数值,-1 ≤ r ≤ 1; >0 为正相关,r<0 为负相关; 3./r/ 越接近于 1,说明相关性越好./r/ 越接近于 0, 说明相关性越差. 相关系数( R)有时又称为皮尔森成果,用来测定两个变量之间的关系强度。某黑带想了解一化学蒸馏流程中氧气的纯度(Y) 与冷凝器中的炭氢化合物的%之间的关系。?数据在 Oxygen 例1 S/N Hydrocarbon % Oxygen purity % 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Minitab :图形?散点图例1例1:散点图 100 98 96 94 92 90 88 86 Hydrocarbon% O x y g e n p u r i t y % Oxygenpurity%与Hydrocarbon%的散点图 100 98 96 94 92 90 88 86 Hydrocarbon% O x y g e n p u r i t y % S R-Sq % R-Sq(调整) % 拟合线图 Oxygenpurity%= +%相关: Hydrocarbon %, Oxygen purity % Hydrocarbon % 和 Oxygen purity % 的 Pearson 相关系数 R =