文档介绍:瑆..甌】卜以.、,.武汉理工大学硕士学位论文。,..,琫、、,,.,,瑄琾琣甌,’..琣
—【瑆,武汉理工大学硕士学位论文..;—,.琓—篋,,
签名:卫卫皇际η┟喊肴掌冢独创性声明关于论文使用授权的说明本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特另员曜⒑椭滦坏牡胤酵猓畚闹胁话他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权保留、送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。C艿穆畚脑诮饷芎笥ψ袷卮斯娑
第绪论研究背景科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据库管理系统的应用领域越来越广泛。条形码和信用卡的普及和使用,进一步加速了商业、金融、保险等领域的信息化进程。人们已经利用计算机取代了绝大部分手工操作。超级市场中的交易数据,加油站里的油料购买数据,旅行社中的旅行信息数据等均是数据库系统的信息来源。最近十几年数据库中存储的数据量急剧增大。例如,轨道卫星上的地球观测系统啃∈被嵯虻孛娣⒒笥业耐枷袷据;世界上最大的数据仓库之一,美国零售系统每天会产生谧笥的交易数据;人类基因组数据库项目已经搜集了数以计的人类基因编码数据等。如此多领域的数据各自存放在相应的数据库中,致使数据库的规模日益扩大,已经达到数十兆字节,有的甚至更大。与此同时,大容量、高速度、低价格的存储设备也相继问世,管理大量数据的数据库管理系统以及各类数据仓库已经能够支持存储、检索如此规模的数据。但目前数据库系统所能做到的只是对数据库中已有的数据进行存取,通过这些数据获得的信息量只占整个数据库信息量的一小部分,因为用来对这些数据进行分析处理的工具很少,而且有局限性。在信息时代,大量信息在给人们带来方便的同时,也带来了一系列问题,比如,信息量过大,超过了人们掌握、消化的能力;一些信息真伪难辨,给信息的正确运用带来困难;网络上的信息安全难以保障;信息组织形式的不一致性,增加了对信息进行有效统一处理的难度等。另一方面,人们意识到隐藏在这些数据之后的更能深层次、更重要的信息能够描述数据的整体特征,可以预测发展趋势,这些信息在决策生产过程中具有重要的参考价值。面对海量数据库和大量繁杂信息,如何才能从中提取出有价值的知识,进一步提高信息的利用率,由此引发了一个新的研究方向:基于数据库的知识发现砺酆图际醯难跋喙氐氖萃诰究。武汉理工大学硕士学位论文
,它融合了数据库技术、人工智能、机器学习⑿畔⒓焖算籔等最新技术的研究成果。经过几十年的研究,产生了许多新概念和新方法。特别是近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发特别需要指出的是,数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理。这里所说的知识发现,不是要求发现放之四海而皆准的真理,也不是要去发现崭新的自然科学定理和纯数学公式。所有发现的知识都是相对的,是面向特定领域的,同时还要能够易于被用户理解。关联规则挖掘是数据挖掘中的主要技术之一,也是在无指导学习系统中挖掘本地模式的最普遍形式。它也是大多数人在试图了解数据挖掘的过程时,所想到的最接近于该过程的形式;关联规则反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到。数据挖掘的概念包含丰富的内涵,是一个多学科交叉研究领域。挖掘的概念不是简单地下个定义就能解决的问题。下面我们就从虳的关系的不同观点中了解数据挖掘的含义【俊看成数据挖掘的一个特例既然数据挖掘系统可以在关系型数据库、事务数据库、数据仓库、空间数据库、文本数据以及诸如榷嘀质葑橹问街型诰蛑J叮敲词菘庵的知识发现只是数据挖掘的一个方面。这是早期比较流行的观点,因此从这个意义上说,数据挖掘是从数据库、数据仓库以及其他数据存储方式中挖掘有用⑼臣蒲、知识工程、面向对象方法、高性能计以及数据可视化展。【理解数据武汉理工大学硕士学位论文猳
.萃诰虻墓知识的过程。这种描述强调了数据挖掘在源数据形式上的多样性。萃诰蚴荎过程的一个步骤为了统一认识,在年出版的权威论文集《知识发现与数据进展》中,琍—和隽薑和数据挖掘的最新定义,将二者加以区分。谴邮葜斜姹鹩行У摹⑿掠钡摹⑶痹谟杏玫摹⒆钪湛梢岳斫獾哪J降数据挖掘是型ü囟ǖ