文档介绍:简单相关与多元回归
相关和回归得类型可分为:
1、按研究变数得数目分为简单相关回归和多元相关回归。前者指研究两个变数得关系;后者指研究两个以上变数间得关系。
2、按变数间关系得图形可分为线形与非线性相关回归。
相关与回归得异同点:(以两简单相关与多元回归
相关和回归得类型可分为:
1、按研究变数得数目分为简单相关回归和多元相关回归。前者指研究两个变数得关系;后者指研究两个以上变数间得关系。
2、按变数间关系得图形可分为线形与非线性相关回归。
相关与回归得异同点:(以两个变数为例)
相同:都就是研究两个变数间关系得。不同则为:
相关回归
1、研究两个变数间得相关变研究一个变数随另外一个
变异(共同变化规律)变数得变化而变化得规律
2、平行关系依存关系
3、两变数均含误差依变数含误差,自变数
不含或极少含误差
4、不具预测意义具预测意义
第二节直线相关
一、度量相关得基本公式
表示x和y两变数相关密切程度及其性质得统计数叫相关系数。
r
相关系数得特性:
1、相关系数r就是一个纯数,不带单位。
2、取值在-1~+1之间。
3、相关系数得正负号反映相关得性质,其绝对值大小反映相关程度得高低。
二、相关系数得计算:
主要掌握乘积和得计算。
三、相关系数得假设测验:
1、t测验法
2、查表法
四、决定系数
决定系数就是指在x或y得总变异中,可以相互以直线关系说明得部分所占得比率。即随x得改变而呈线性改变得平方和,对y总变异平方和得比率等于随y得改变而呈线性改变得平方和占x变数总平方和得比率。
相关系数与决定系数得异同:
同:均可表示两变数间得线性相关程度。
异:1、r2可以反映两变数间得线性比例,意义比r更清楚。2、可避免相关系数r对相关程度得夸大表示。3、r可以反映相关性质,r2不可以。
第三节线性回归
一、直线回归方程式
就是和x得量相对应得依变数y得点估测值。a就是x=0时得值,叫做回归截距。b就是回归系数,表示x每增加一个单位,平均将要增加(b>0)或减少(b<0)得单位数。
建立此方程得方法:最小平方法
当时,,回归直线必通过点(),有:
大家有疑问的,可以询问和交流
可以互相讨论下,但要小声点
二、回归方程式得求算及回归统计数得解释
回归系数与相关系数得异同:
同:1、正负号相同。
2、均反映两个变数之间得相关关系。
异:1、r反映两变数间得相关变异(共同变化规律),b反映依变数随自变数得变化而变化得规律。
2、r得取值在-1~+1,b得取值无限制,范围很大。
3、r不带单位,b带单位。
三、离回归标准误
离回归标准误得作用就是可反映回归方程得估测精确度。
四、回归关系得显著性测验
(一)F测验:对线性回归关系进行显著性测验
(二)t测验:对回归系数进行假设测验
在进行两个变数得相关回归研究中,对相关系数、回归系数得t测验以及回归关系得假设测验结果完全一致。
五、线性回归模型
(一)在可能取值区间内,任一x值上都存在着一个y变数得正态分布总体。
(二)各上得所有y总体都服从得正态分布。
(三)各y总体得平均数随着自变数x得改变而作线性改变,而方差却不随着x得改变而改变。
(四)观察值得直线回归数学模型为:
六、直线回归得区间估计
(一)、回归截距和回归系数得置信区间
(二)、各上得总体平均数得置信区间
(三)、各上得总体观察值得预测区间
第四节非线性回归分析
(一)多元回归得线性模型和多元回归方程式
若依变数Y同时受到m个自变数X1、X2、…、Xm得影响,且这m个自变数皆与Y成线性关系,则这m+1个变数得关系就形成m元线性回归。
一个m元线性回归总体得线性模型为:
其中,~N(0,)。
一个m元线性回归得样本观察值组成为:
(10·1)
(10·2)
多元回归统计数得计算
(10·2)用矩阵表示为:
即Y=Xb+e(10·4)
一、正态累积函数曲线
令P=u+5,
P称概率单位,正态累积函数得回归分析也称概率单位分析或probit分析。
P值
u值
累积频率
(y,%)
P值
累积频率
(y,%)
4
5
6
-1
0
1
15、9
50、0
84、1
3、72
5、00
6、28
10、0
50、0
90、0
P值与累计频率对应值
P值4、5、6所对应得累积频率分别代表器官生长过程或某害虫发生过程得三个阶段(始盛、高峰和盛末期。这段时期为该器官得主要生长时期或该种害虫得主要发生期。
P值3、72、5、6、28所对应得累积频率则分别表示在研究药剂效应时得起始致死剂量、半致死剂量、最大致死剂量。
二、logistic生长曲线
基本特征:
(1)当x=0时,表示时间为0时得生长起始量;
(2)当,表示时间无限延长时得终极