1 / 52
文档名称:

基于数据挖掘的航班延误预测模型及方法的研究.pdf

格式:pdf   页数:52
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据挖掘的航班延误预测模型及方法的研究.pdf

上传人:banana 2014/2/8 文件大小:0 KB

下载得到文件列表

基于数据挖掘的航班延误预测模型及方法的研究.pdf

文档介绍

文档介绍:南京航空航天大学
硕士学位论文
基于数据挖掘的航班延误预测模型及方法的研究
姓名:刘小飞
申请学位级别:硕士
专业:计算机科学与技术
指导教师:王建东
2010-12
南京航空航天大学硕士学位论文
摘要
航班延误作为一个热点问题一直困扰着国际国内民航业。近些年来,随着我国航空延误情
况日益加重,国内民航业的发展已经受到严重影响,改善延误状况迫在眉睫。对于繁忙的机场
来说,延误航班数量的预测对机场来说意义重大。这是因为延误航班越多就意味着滞留旅客的
人数越多,当滞留旅客达到一定人数(或延误航班达到一定数量)时,机场必须采取相应的预案
进行干预。因此,如果能够提前对延误航班数量进行预警,对机场相关部门来说无疑会有很大
的帮助。
随着社会和科技的进步,人们所能收集到的数据量变得越来越大,对这些数据进行处理和
预测的难度也因此变得非常大。而新兴的处理海量数据的技术一一数据挖掘为解决预测的这一
难题提供了新的手段。本文以航班延误预测为应用背景,首先针对航班延误问题建立了时间序
列预测模型,使用数据挖掘中的几种常见建立预测模型的方法,如线性回归,非线性回归,神
经网络等,对某大型机场实际航班运行数据进行分析处理,建立相应的航班延误预测模型。为
了进一步提高预测的精度,本文还提出了一个融合先验知识的支持向量机回归方法。通过把先
验知识定义成数据集上的约束关系,进行模型的学习训练。由于这种新的方法加入了先验知识,
它较之现有的一些方法预测效果更为准确。本文还通过实验,将所提出的方法与标准支持向量
机回归方法进行了对比,实验结果表明了这种新的预测方法的有效性。

关键词:航班延误,数据挖掘,预测,先验知识,支持向量机回归

I
基于数据挖掘的航班延误预测模型及方法的研究
Abstract
Flight delays have plagued the international and domestic civil aviation industry is a hot issue.
In recent years China Airlines is increasing the delay has affected the aviation industry, to improve
the situation of imminent delays. For the busy hub airports, the delays in warning the number of
flights the airport is of great significance. This is because the number of delayed flights means that the
number of stranded passengers, when a certain number of stranded passengers (or a certain number
of delayed flights), the airport must take the appropriate plan for intervention. Therefore, if advance
warning of the number of delayed flights, the airport is undoubtedly related departments will be very
helpful. This article on a busy airport flight information table as the main object of study, for each
time period in which the number of delayed flights modeling and forecasting.
As society and the advancement of technology, people can gather to e larger and larger
amount of data, these data processing and therefore difficult to predict e very large. The
emerging one by one dealing with massive data mining technology to solve this problem prediction
provides a new oppo