文档介绍:§5 离散计数数据模型(Models For Count Data)
一、问题的提出
二、泊松回归模型
三、泊松回归模型的扩展
一、问题的提出
1、经济、社会活动中的计数数据问题
发生事故次数的影响因素分析
更换工作次数的影响因素分析
婚姻问题研究
2、计量模型中的计数数据问题
通常计数数据模型的形式可以表示如下:
其中N代表被解释变量,通常为正整数,N和X之间的关系由经济理论决定。
该模型假定,通过调查能够得到一组代表被解释变量的数字(如0,1,2,3…)以及相应的解释变量的观察值。
建立模型的目的主要有两点:
检验从数据中可以观察到的行为模式是否与理论预期相符;
将N和X之间的内在联系用数量化的方式表现出来。
从理论上讲,多元线性方程的参数估计方法也可以被应用来分析计数数据模型问题。
但是很容易发现,计数数据中零元素和绝对值较小的数据出现得较为频繁,而且离散特征十分明显,利用这些特点,可以找到更合适的估计方法。
七十年代末以来,许多学者在计数数据模型的处理方法方面作出了较大贡献,包括:
Gilbert(1979)提出了泊松回归模型,
Hausman,Hall和Griliches(1984)提出了负二项回归模型和Panel方法,
Gourier,Monfort和Trogonon(1984)提出了仿最大似然法。
其中,最先提出的泊松方法在研究计数数据模型问题中应用得非常广泛。
二、泊松回归模型
1、泊松回归模型
泊松回归模型假定,被解释变量yi服从参数为i的泊松分布,其中i同解释变量xi存在某种关系。该模型的初始方程为:
最常用的关于i的方程是对数线性模型,即
根据泊松分布的性质
2、泊松回归模型的ML估计
是一个非线性模型,最简单的方法是最大似然估计法。对数似然函数为:
可以利用Newton迭代法迅速地得到方程的参数估计值。