文档介绍:-
. z.
房价影响因素回归分析
摘要 研究选择地区房价与多个可能相关的变量, 建立计量经济学模型从而估计各因素的影响程度。通过数据采集后,画图,看走势,合理建立多元回归51
2021
87475
519,
4 模型的建立
画散点图及公式建立
首先,通过被解释变量与解释变量的散点图大致判断房价与其余几个变量的函数关系。程序见附录,图一为y与*1的散点图。其他图类似,在此省略。程序见程序1。
图一
由图一知,我们不能简单的假设房价与其他变量是线性关系,同时我做出了俩边取对数与只对于y去对数的比较。图二为lny与*1的图像,图三为lny与ln*1的图像。见程序2。
图二
图三
由图二和图三知,〔当然不止是这俩个图,其他变量的得到的图像大多与上类似〕我们得到模型对y取对数的图像最符合线性关系。
所以建立模型
〔2〕
〔OLS〕估计回归模型
程序见附录程序3,
-
. z.
图四
根据上面模型,=,可决系数高,拟合度好。
图五
由数据可知该模型的有些变量数据拟合不够好,进展多重共线性检验。见程序4。
图六
由图六知方差膨胀因子有的都到达上万,有严重共线性,进展逐步回归。见程序5。
第一步:引入*9,模型的拟合度提高,参数符号合理,通过了t检验。
第二步:引入*3,模型的拟合度提高,参数符号合理,通过了t检验。
第三步:引入*8,模型的拟合度提高,参数符号合理,通过了t检验。
第四步:引入*6,模型的拟合度提高。
第五步:去掉其他变量。
看处理多重共线性后膨胀因子:
图七
由以上结果可知,数据明显有了不少的优化,虽然大于10,但相对于原先的成千上万好了非常多。认为已抑制多重共线性。见程序6。
故抑制多重共线性后的模型为:
〔3〕
5 相关检验
经济意义检验
人口的增加引起房价的下降,竣工面积的增加引起房价的负增长,这显然是不合理的。但考虑到*8待销售面积的增加引起房价的下降符合经济意义。我们暂时认为其组合表示一种比较复杂的供求关系。
人民币的发行量越多房价越上涨也符合经济意义。
-
. z.
统计检验
〔1〕拟合优度:,故本模型拟合效果很好。
〔2〕由图七知,,所以回归系数显著。
异方差的检验
.1图示检验法检验异方差
程序见附录,在此仅列出*6与的图像。见附录程序7。
图八
可以看出图像图像的走势不易确定〔整体成直线,但结尾几个点又明显向上〕
.2戈里瑟法检验法检验异方差
程序见附录程序8,
图九
t值对应p值都未通过检验,因此通过原假设,即模型不存在异方差。
.3 G-Q检验法检验异方差
程序见附录程序9,
G-Q检验适用于样本容量较大,且异方差为单增或单减的情况,但模型我们也检验一下。模型样本容量为16,去掉中间16/4=4组观测,分为各有6个容量的两个样本。再分别对模型进展线性回归。
输出结果如下:
子样本1:,,
子样本2:,,
,服从F〔1,1〕,,临界值为161,远小于。所以不存在异方差。〔当然此方法适合大样本,在此主要是学习此方法〕
.4没有穿插项的怀特检验法检验异方差
程序见附录程序10,
图十
由小于查表下的自由的为8,,不存在异方差。
序列相关性检验
.1 DW检验法检验序列相关性
程序见附录程序11,
图十一
-
. z.
,落入〔其中,〕无法确定是否具有自相关。
.2 拉格朗日乘数检验检验序列相关性
程序见附录程序12
含1阶滞后残差项的辅助回归拉格朗日乘数检验序列相关运行结果
图十二
LM=15*=,该值小于显著性水平为5%。
图十三
LM=14*=,该值小于显著性水平为5%。
.3 多重共线性检测
程序见附录程序13,在置信水平为5%,只剩下*9。当然上面已经抑制多重共线性,在此就不赘述。
5.4 经济模型预测检验
根据上式,代入2021年人口*3