文档介绍:应用数理统计大作业
学院名称
学号
学生姓名
摘要
本文以哈尔滨商品房价格为研究对象,选取2000年到2010年11年期间哈尔滨商品房平均销售价格为因变量,7个可能影响哈尔滨商品房平均销售价格的因素为自变量,利用统计软件SPSS,建立了逐步回归模型,并最终确定了能反映哈尔滨商品房平均销售价格与各因素之间关系的最优回归方程。
关键词:多元线性回归,逐步分析法,SPSS,哈尔滨商品房平均销售价格
1、引言
随着近几年房价的迅速攀升与不稳定性,使得居民对房地产市场的走向很模糊,大多数居民望房兴叹。尽管对此我国政府也陆续出台了相关的政策,但是结果却不尽如人意。这带来了很多的社会问题,加深了社会各阶层的矛盾。房地产既是国民经济的支柱产业,同时也和广大人民的生活息息相关,因此弄清影响房地产价格的因素显得尤为必要。哈尔滨作为二线城市,较一线城市相比较影响因素相对简单,针对哈尔滨的实际情况,充分考虑各种社会因素对商品房价格的影响,可以采用逐步回归模型对其房地产价格进行预测。
逐步回归法
建立最优多元回归方程的一种统计方法。在一个多变数系统中,往往含有对依变数y有显著效应的和没有显著效应的两种自变数。必须将没有显著效应的自变数一步一步地剔除干净, 使所得多元线性回归方程简化而又能较准确地预测y的反应量。通常是从一元回归分析开始,每一步选入一个最显著的自变数,直至选入的自变数都显著,而未选入的自变数都不显著为止。这种统计选入方法叫做逐步回归方法。它是由若干步骤组成的, 每一步骤包括四个计算程序:
①算出各个尚未入选自变数的偏回归平方和U(k)Pi(k=1,2,……. 表示第k步回归)。
②比较各UPi(k),找出最大的U(k)Pi记为maxU(k)Pi。
③对maxU(k)Oi作偏回归的F测验, 如果显著就将该自变数在第k步选入回归方程;如果不显著就表示已没有可入选的自变数逐步回归结束。
④当maxU(k)Pi为显著而将自变数选入后,要对在第k步之前已入选的所有自变数再作一次偏回归显著性的F测验, 若有变为不显著的, 即予剔出。因此, 逐步回归的每一步骤, 都能保证只有显著的自变数才能进入回归方程。
逐步回归方法, 对于多变数资料中众多自变数的选优有很好效果。所得的线性回归方程, 将是包含自变数的个数最少而又具有较好的预测精度的最优方程。
数据整理
本文对哈尔滨商品房价格进行研究,通过分析并结合哈尔滨市房地产市场状况,选择年末总人口、市区生产总值、市区人均工资、利率、商品房销售面积、房地产开发投资、商品房竣工面积作为解释变量,采用2001-2010的房地产相关数据(见表1)作为样本,来分析各因素对房地产价格的影响。
表1 原始数据
年份
年末总人口(万人)
市区生产总值(亿元)
市区人均工资(元每人)
利率
商品房销售面积(万平方米)
房地产开发投资(万元)
商品房竣工面积(万平方米)
商品房平均销售价格(元每平方米)
2000
299
7512
1919
2001
304
8429
2154
2002
307
9496