文档介绍:决策树在购房中的应用
作者:
摘要:决策树是一种广泛用于数据分类的方法,也是数据挖掘中常用的方法。,它与经典的ID3算法相比,将ID3的信息增益改为信息增益比,增加了对连续属性的处理。本文将深入的研究此算法,将此算法应用于购房中的数据挖掘,对收集来的购房数据进行挖掘,得到购房的决策树,实现科学、直观购房的决策。论文以PHP和MySQL实现此数据挖掘。
关键词:决策树;数据挖掘;购房
The Decision Tree application in the purchase house
Author: Ke Zhang
Abstract:Decision Tree is widely used in the method of data classification,and monly used in the method of Data , Decision Tree algorithm is the most classical algorithm, comparing it with classic ID3 algorithm,will modifies the information gain as the information gain ratio,and increases the processing of the continuous attributes. This article will in-depth researches this algorithm, will apply this algorithm to the Data Mining of the purchase, mines the collected purchase datas,gets the decision tree of the purchase, realizes science, plishes the decision of the article realizes the Data Mining with PHP and MySQL.
Keywords: Decision Tree;Data Mining;purchase house.
问题描述
课题背景及研究意义
近些年来,房地产市场不断升温,房价也是节节攀升。据统计,海南海口住房2006年均价2500元每平方米,2007年上升到3500元每平方米,2008达到平均4300元每平方米,2009年升至5500元每平方米,2010年更是攀升至6700元每每平米的高价。对于普通家庭来说购买一套合适的住房可能是一生中最大的投资,仓促的做出购房决策可能会影响到家庭将来的生活质量与幸福。因此,对于很多家庭来说购房不得不慎重的考虑购房问题,再加上现在房地产市场也在不
断地推出很多新的楼盘,房屋价格、环境、面积、户型等各有不同各有各的优缺点。对于购房家庭或者本人来说,房屋经济又舒适是非常不错的,但是购房者对住房的价格,环境的优越性,小区的服务质量,户型上的合理性等等诸如此类的问题难免会遇到选择上的困惑。这些都使得购房者做出购房决策难上加难。
针对这一状况,创建一个从众多购房经验中挖掘出能为购房者提供客观、科学的购房决策十分有意义。
国内外研究现状
目前,针对于这一情况,国内外的研究主要采用以下几个方法来实现购房决策的:
:美国运筹学家T. L. Saaty教授在上世纪70年代初期提出了层次分析法,它是对某一个提出的问题进行一定量的分析,它使用起了非常的方便、灵活,它也是十分的有用并以多方面为准则的一种方法。此方法的优点是把不同的问题中的不同因素分类成有联系的有次序的层次,使问题变得清楚,明晰,根据一定的规则把分析者的意见和专家的意见有机的联系起来,它是一种比较复杂的连接,它是把同一层次中的所有元素仔仔细细的比较以后,用科学的方法找出可以体现出同一层元素中相对至关重要的权值,最后把所有的层次之间进行从小到大的排序并通过这排序找出全部元素的相对权重[1]。
:①熵值法, 在信息论中,熵是对某一个问题的不确定性的一种衡量。信息量越多,不确定性就非常的小,熵值它也跟着就小;反之,就会变得比较大。根据熵的这种特殊的性质,我们可以大概的判断某些问题的随机性有多大,同样可以用来计算某个问题的离散度到底有多大,离散度越大,对最后结果影响也就越深。②TOPSIS(Technique for OrderPreference by Similarity to an Ideal Solution)[1