文档介绍:第五章经典单方程计量经济学模型:专门问题
§ 虚拟变量
§ 滞后变量
§ 设定误差
§ 建模理论
§ 虚拟变量模型
一、虚拟变量的基本含义
二、虚拟变量的引入
三、虚拟变量的设置原则
一、虚拟变量的基本含义
许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等
但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”,
这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。
例如,反映文程度的虚拟变量可取为:
1, 本科学历
D=
0, 非本科学历
一般地,在虚拟变量的设置中:
基础类型、肯定类型取值为1;
比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪金的模型:
其中:Yi为企业职工的薪金,Xi为工龄,
Di=1,若是男性,Di=0,若是女性。
二、虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。
企业男职工的平均薪金为:
上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。
在该模型中,如果仍假定E(i)=0,则
企业女职工的平均薪金为:
1、加法方式
几何意义:
假定2>0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差2。
可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。
0
2
又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下,
高中,
大学及其以上
模型可设定如下:
这时需要引入两个虚拟变量:
在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:
高中以下:
高中:
大学及其以上:
假定3>2,其几何意义:
还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:
本科及以上学历
本科以下学历
职工薪金的回归模型可设计为: