文档介绍:第九章直线回归和相关
第一节回归和相关的概念
第二节直线回归
第三节直线相关
第四节直线回归与相关的内在关系
和应用要点
第五节协方差分析
引言
这一章研究的对象:
由一个变数两个或多个变数,因为在实际生产实践和科学实验中所要研究的变数往往不止一个,例如:
研究温度高低和作物发育进度快慢的关系,就有温度和发育进度两个变数;
研究每亩穗数、每穗粒数和每亩产量的关系,就有穗数、粒数和产量三个变数。
第一节回归和相关的概念
1. 函数关系与统计关系
2. 自变数与依变数
3. 回归分析和相关分析
4. 两个变数资料的散点图
函数关系有精确的数学表达式
(确定性的关系) 直线回归分析
一元回归分析
变量间的关系
因果关系曲线回归分析
(回归分析)
多元回归分析多元线性回归分析
统计关系多元非线性回归分析
(非确定性的关系)
简单相关分析——直线相关分析
相关关系复相关分析
(相关分析) 多元相关分析
偏相关分析
函数关系是一种确定性的关系,例如圆面积与半径的关系为。其不包含误差的干扰。
统计关系是一种非确定性的关系。例如,作物的产量与施肥量的关系,两类变数受误差的干扰表现为统计关系。
因果关系:两个变数间的关系若具有原因和反应(结果)的性质。
相关关系:呈现一种共同变化的特点,则称这两个变数间存在。
回归分析:计算回归方程为基础的统计分析方法。
为Y 依X 的回归方程(regression equation of Y on X )。
相关分析:计算相关系数为基础的统计分析方法。计算表示Y 和X 相关密切程度的统计数,并测验其显著性。
这个统计数在两个变数为直线相关时称为相关系数(correlation coefficient),记为r;在多元相关时称为复相关系数(multiple correlation),记作Ry·12…m ;在两个变数曲线相关时称为相关指数(correlation index),记作R。
一般规则:
当两个变数中Y 含有试验误差而X 不含试验误差时着重进行回归分析;而当Y 和X 均含有试验误差时则着重去进行相关分析。
4. 两个变数资料的散点图
对具有统计关系的两个变数的资料进行初步考察的简便而有效的方法,是将这两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatter diagram)。
根据散点图可初步判定双变数X 和Y 间的关系,包括:①X 和Y 相关的性质(正或负)和密切程度;
②X 和Y 的关系是直线型的还是非直线型的;
③是否有一些特殊的点表示着其他因素的干扰等。
,(X )和稻谷产量(Y ),(X )和结实率(Y ),(X )和每亩稻谷产量(Y )。从中可以看出:①,但方向
相反;前者Y 随X 的增大而增大,表示两个变数的关系是正的,后者Y 随X 的增大而减小,表示关系是负的。②,;因此, 和Y 。③ 和Y 的关系是非直线型的;大约在x≤(6—7)时,Y 随X 的增大而增大,而当x>(6—7)时,Y 随X 的增大而减小。