文档介绍:第八章
虚拟变量回归
计量经济学
1
在对在校学生的消费行为进行的调查中,发现在校生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。显然,男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?
面临的问题:如何把男女生这样的非数量变量引入方程?
引子:男女大学生消费真有差异吗?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。
如何对非定量因素进行回归分析?
采用“虚拟变量”对定性变量进行量化一种思路。
3
第八章虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
●虚拟被解释变量的回归(选讲,不包括)
4
第一节虚拟变量
本节基本内容:
●基本概念
●虚拟变量设置规则
5
一、基本概念
定量因素:可直接测度、数值性的因素。
定性因素:属性因素,表征某种属性存在与否的
非数值性的因素。
基本思想:
直接在回归模型中加入定性因素存在诸多的困难
(那些困难?),是否可将这些定性因素进行量
化,以达到定性因素能与定量因素有着相同作用
之目的。
6
计量经济学中,将取值为0和1的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母D或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。
对定性变量的量化可采用虚拟变量的方式实现。
虚拟变量的定义
7
虚拟变量的设置规则涉及三个方面:
1.“0”和“1”选取原则
(状态、水平)因素与设置虚拟变量
数量的关系
方面的问题
二、虚拟变量设置规则
8
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。
从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。
“0”代表基期(比较的基础,参照物);
“1”代表报告期(被比较的效应)。
9
例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。
例1
问题:
为何只选0、1,选2、3、4行吗?为什么?
10