1 / 2
文档名称:

基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告.docx

格式:docx   大小:10KB   页数:2页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告.docx

上传人:niuwk 2024/4/13 文件大小:10 KB

下载得到文件列表

基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告.docx

相关文档

文档介绍

文档介绍:该【基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告 】是由【niuwk】上传分享,文档一共【2】页,该文档可以免费在线阅读,需要了解更多关于【基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告本研究旨在基于数据挖掘方法,提出一个商品房销售决策支持模型,用于辅助开发商、经纪人等销售人员做出更准确的销售决策。本中期报告总结了研究进展情况,包括数据采集、数据预处理、数据分析及模型构建等方面。一、数据采集通过网络爬虫技术,我们获取了一份包括房屋基本信息、房屋售价、房屋成交时间等数据的商品房销售数据集。数据集包含了2015年至2020年上半年北京市985所院校周边(5公里内)的商品房销售数据,包括二手房和新房,共计4348条记录,其中训练集为3478条,测试集为870条。二、数据预处理对数据进行了预处理,包括数据清洗、缺失值填充、特征选择等。数据清洗的过程中,我们剔除了重复记录、异常值和无法处理的空数据。在缺失值填充方面,我们采用均值填充法和中位数填充法来填充缺失值。在特征选择方面,我们采用相关系数法、卡方检验法和信息增益法等方法来筛选特征,并保留了与房价相关性最强的13个特征。三、数据分析对数据进行了统计分析和可视化分析,得到了数据的分布情况、相关性、异常值等信息。对于连续型属性,我们进行了箱线图和直方图分析,发现了数据中存在一些较为极端的异常值。我们对这些异常值进行了处理,采用了删除和均值填充的方法。对于离散型属性,我们进行了频率分析和条形图分析,找到了属性之间的关联性和区别性。四、模型构建我们尝试了多种数据挖掘模型,包括线性回归、决策树、随机森林和神经网络等。通过比较各个模型的精度和效率,我们最终选择了随机森林模型作为最终的商品房销售决策支持模型。随机森林模型具有较高的准确率和较好的预测效果,能够很好地处理多重共线性、非线性关系和特征交叉等问题。五、总结本中期报告介绍了基于数据挖掘方法的商品房销售决策支持模型的研究进展情况,包括数据采集、数据预处理、数据分析和模型构建等方面。未来,我们将进一步完善模型,尝试使用更多的算法优化预测精度,结合其他方法进行更深入的分析。