文档介绍:上海交通大学
硕士学位论文
分类方法在交通数据挖掘系统的应用研究
姓名:方烈
申请学位级别:硕士
专业:计算机应用
指导教师:李明禄
20061201
上海交通大学硕士学位论文
分类方法在交通数据挖掘系统的应用研究
摘要
近年来,随着我国经济建设的持续高速发展和城市现代化进程的加
快,城市智能交通建设得到了长足的发展。智能交通系统中积累了大量
的交通数据,为数据挖掘技术在城市交通领域中的发展提供了广泛的数
据支持。同时,交通数据的实时性和复杂性也对数据挖掘技术的发展提
出了巨大的挑战。
本文以车辆 GPS 信息为研究内容,以分类模型为研究主线,对数据
挖掘过程中几个重要阶段(包括数据预处理技术、数据挖掘建模、模型
评估)及其具体技术分别进行了研究:
首先,介绍了数据挖掘技术产生的背景,定义和功能,及其在交通
信息数据处理领域的研究现状。接着着重阐述了数据挖掘中的分类技术,
从分类的一般方法入手,分析并比较了几种不同分类方法和分类性能评
估方法。分类方法包括决策树,K-最近邻分类,神经网络和贝叶斯分类;
分类性能评估方法包括保持方法,随机二次抽样,交叉验证和自助法。
其次,分析了数据挖掘中的预处理技术。其中最重要的技术是数据
离散化和属性简约。这两种技术分别被运用到了对车辆 GPS 数据,包括
经度坐标,纬度坐标,速度,角度的处理中。研究了决策树分类模型,
2
上海交通大学硕士学位论文
基本算法以及具有可伸缩性的改进算法。提出了用分类树的方法解决单
个车辆 GPS 坐标匹配多条道路的问题。该方法利用精确匹配的车辆 GPS
坐标训练和生成决策树,在利用该决策树判断可能匹配多条道路的车辆
GPS 坐标。
最后,研究了模糊粗糙集理论,提出了在现有认识能力有限的条件
下分析和解决复杂问题的一般方法。将其应用于道路交通状况预测中,
完成基于模糊粗糙集的道路预测模型和算法。该模型通过计算道路交通
状况的模糊上近似和模糊下近似来预测路况。对比预测结果和实际数据,
证明该模型具有一定的准确性。
目前,随着数据挖掘技术在各个领域中的不断发展,人类发现知识
的方式正在不断的改变。数据挖掘技术在智能交通系统中的应用研究,
也必将促进未来城市道路交通的发展。
关键词: 数据挖掘分类方法 GPS 匹配交通预测
3
上海交通大学硕士学位论文
Research on Traffic Data Mining System
Using Classification Methods
ABSTRACT
Nowadays, as the Economic and Social develop very fast, Intelligent
Transportation Systems has been widely applied. These systems collect
plenty of traffic data which can support the development of data mining
technology in the traffic domain. At the meantime, the traffic data is real-time
plicated, it will challenge the technology.
This paper bases on GPS information of traffic and uses classification
method. It studies several important phases (data pre-processing, model
building, model testing) and technology of data mining.
First we introduce the birth, definition and function of data mining
technology, as well as its employment in current Intelligent Transportation
Systems. Then we elaborate the classification models of data mining. Starting
with the general method of classification, pare several classi