文档介绍:应用回归分析
第1页,本讲稿共20页
统计软件
SPSS 最新版本
Statistical Package for the Social Science
第2页,本讲稿共20页
章 节 目 录
第变量,后者不是。
1 .1 变量间的统计关系
第10页,本讲稿共20页
回归分析构成计量经济学的方法论基础,其主要内容包括:
(1)根据样本观察值对经济计量模型的参数进行估计,求得回归方程;
(2)对回归方程、参数估计值进行显著性检验;
(3)利用回归方程进行分析、评价及预测。
1 .1 变量间的统计关系
第11页,本讲稿共20页
1 .2 回归方程与回归名称的由来
(1822-1911年)和他的学生、(1856—1936年)在研究父母身高与其子女身高的遗传问题时,观察了1 078对夫妇, 他们以成年儿子身高作为纵坐标,夫妇平均身高为横坐标做散点图,结果发现两者的关系近似于一条直线,经计算得到如下方程:
1. 回归方程
2. 回归方程的由来
第12页,本讲稿共20页
1 .3 回归分析的主要内容及其一般模型
回归分析的主要内容
第13页,本讲稿共20页
回归分析的一般形式
随机误差项主要包括下列因素:
(1)在解释变量中被忽略的因素的影
(2)变量观测值的观测误差的影响;
(3)理论模型设定误差的影响;
(3)其他随机因素的影响。
1 .3 回归分析的主要内容及其一般模型
第14页,本讲稿共20页
1 .4 建立实际问题回归模型的过程
设置指标变量
收集整理数据
构造理论模型
估计模型参数
修改
N
模型运用
Y
经济因素分析
经济变量控制
经济决策预测
实 际 问 题
模型
检验
第15页,本讲稿共20页
一、设置指标变量
根据研究目的,利用经济学理论,从定性角度来确定经济问题中各因素之间的因果关系。
指标变量不容易确定:
1. 认识的局限性;
2. 为了模型参数估计的有效性,设置的解释变量应该是不相关的,可是在经济问题中很难找到.
3. 从经济学角度考虑应该引进非常重要的经济变量,但是在实际中没有这样的数据,或数据很难拿到,可以考虑用相近的变量代替,或由其他几个指标符合成一个新的指标.
4. 并不是模型中所涉及的解释变量越多越好
(1) 可能会引进与问题无关的变量;
(2) 容易产生共线性—信息重叠
(3) 计算量大,误差累计大,估计模型参数精度不高.
1 .4 建立实际问题回归模型的过程
第16页,本讲稿共20页
1 .4 建立实际问题回归模型的过程
二. 收集整理统计数据
时间序列—按时间顺序排列的数据
横截面数据—同一时间截面上的统计数据.
面板数据—是截面数据与时间序列数据综合起来的一种数据类型。例如2000、
2001、2002、2003、2004各年中国所有直辖市的GDP分别为(单位亿元):
北京市 8、9、10、11、12;
上海市 9、10、11、12、13;
天津市 5、6、7、8、9;
重庆市 7、8、9、10、11
2. 注意的问题
( 1) 数据的可比性: 按可比价格计算,扣除价格变动因素,确切反映实物量的变化.
当年价格(报告期实际价格)用价格指数换算成可比价格.
(2) 统一计算口径. 如GDP(按国土原则计算)GNP(按国民原则计算).两者包含内
容一致,但是计算口径不同.
(3) 样本容量:
(4) 统计数据整理: 折算,差分,对数化,标准化,剔除异常值,插值法补齐缺失数据等.
第17页,本讲稿共20页
1. 绘制散点图(SPSS,S-PLUS)
2. 依据:经济理论和一些数理经济学结果(计量经济学,数量经济学)
如 C-D生产函数(柯布道格拉斯生产函数)
数据对数化等.
,极大似然估计
2. 岭回归 主成分回归 偏最小二乘回归
3. 软件: spss sas s-plus eviews
1 .4 建立实际问题回归模型的过程
第18页,本讲稿共20页
检验: 1. 回归方程
2. 回归系数
3. 拟合优度
4. 随机误差项序列的相关性 异方差
修改:从设置变量是否合理开始—是否遗漏变量,变量间的依赖性