1 / 6
文档名称:

数据挖掘技术综述.doc

格式:doc   大小:20KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘技术综述.doc

上传人:s1188831 2019/12/22 文件大小:20 KB

下载得到文件列表

数据挖掘技术综述.doc

文档介绍

文档介绍:0引言随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计,如何从海量的数据中提取有用的知识成为当务之急。由于这些资料十分的繁杂,仅仅依靠数据库的查询检索机制和统计学方法已经远远不能够满足现实需要了,因此人们提出了数据挖掘技术。人们通过数据挖掘技术自动地和智能地将待处理的数据转化为有用的信息和知识,达到决策服务的目的。1数据挖掘定义数据挖掘的定义很多,虽然表达方式不同,但本质是一样的。目前比较公认的定义是:数据挖掘(DataMining是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程。在此定义中,要求数据源是大量的、真实的、含有噪音的;所发现的信息和知识是潜在的并隐藏在大量数据背后的,是用户感兴趣的、可理解、可运用的知识。所以数据挖掘有时候也被人们称为知识挖掘、知识提取(KnowledgeExtraction、知识发现(KDD,KnowledgeDiscoveryinDatabases等。数据挖掘是一门新兴的交叉学科,把人们对数据的应用从低层次的简单查询提升到从数据库中挖掘知识,提供决策支持。2数据挖掘的方法数据挖掘方法通常可以分为两大类:一类是统计分析型,常用的技术有概率分析、相关性、聚类分析和判别分析等;另一类是知识发现型,通过训练和学****大量的样本集得到需要的模式和参数。常用的数据挖掘方法有以下几种:(1决策树方法决策树可用于分类,通常根据给定的训练样本数据集来构建分类模型,以树的形式来表达模型。决策树的算法通常分为两个阶段:决策树的构建和决策树的修剪。模型建成后,对树中的每一类别的描述形成分类规则。目前已形成了多种决策树算法,如ID3、、CART、SLIQ、SPRINT等。(2遗传算法遗传算法模仿了生物进化的过程,通过进行选择、交叉和变异遗传操作,直至找到最优解。在数据挖掘时,通常把任务表示成一种搜索问题,利用遗传算法强大的搜索能力找到最优解。遗传算法已在优化计算和分类机器学****方面显示出了明显的优势。(3粗糙集(RS粗糙集是一种研究含糊性和不确定性问题的数学工具。这一方法在数据挖掘中能发现不准确数据或噪声数据内的结构联系,也可以用于特征归约和相关分析。其主要优点在于不需要任何关于数据的初始的或附加的信息,因此广泛应数据挖掘技术综述ReviewofDataMing万韵1,2刘建辉1WanYunLiuJianhui(,江西南昌330013;,江西南昌330045(,EastChinaJiaotongUniversity,JiangxiNanchang330013;,JiangxiArgricultureUniversity,JiangxiNanchang330045摘要:数据挖掘是目前信息领域和数据库技术的前沿研究课题,本文介绍数据挖掘的定义、方法、过程及应用,并对数据挖掘的发展趋势进行了分析。关键词:数据挖掘;知识发现;关联规则中图分类号:TP311文献标识码:A文章编号:1671-4792-(20093-0243-02Abstract:DataMiningisafron