1 / 7
文档名称:

数据挖掘论文.doc

格式:doc   大小:68KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘论文.doc

上传人:小博士 2019/8/5 文件大小:68 KB

下载得到文件列表

数据挖掘论文.doc

相关文档

文档介绍

文档介绍::..数据挖掘课程论文数据挖掘技术及其应用的实现数据挖掘技术及其应用的实现摘要:随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越來越多。数据挖掘(DataMining)就是从大量的实际应用数据中提取隐含信息和知识,它利用了数据库、人工智能和数理统计等多方面的技术,是一类深层次的数据分析方法。本文介绍了数据库技术的现状、效据挖掘的方法以及它在Bayesian网建网技术中的应用:通过散据挖掘解决Bayesian网络建模过程屮所遇到的具体问题,即如何从太规模效据库屮寻找各变量之间的关系以及如何确定条件概率问题。关键字:数据挖掘、知识获取、数据库、函数依赖、条件概率一、引言:数据是知识的源泉。但是,拥有大量的数据与拥冇许多有用的知识完全是两回事。过去几年中,从数据库中发现知识这一领域发展的很快。广阔的市场和研究利益促使这一领域的飞速发展。计算机技术和数据收集技术的进步使人们可以从更加广泛的范围和儿年前不可想彖的速度收集和存储信息。收集数据是为了得到信息,然而大量的数据木身并不意味信息。尽管现代的数据库技术使我们很容易存储人量的数据流,但现在还没右一种成熟的技术帮助我们分析、理解并使数据以可理解的信息表示出來。在过去,我们常用的知识获取方法是由知识工程师把专家经验知识经过分析、筛选、比较、综合、再捉取出知识和规则。然而,由于知识工程师所拥有知识的有局限性,所以对于获得知识的可信度就应该打个折扣。口前,传统的知识获取技术面对巨型数据仓库无能为力,数据挖掘技术就应运而生。数据的迅速增加与数据分析方法的滞后Z间的孑盾越來越突出,人们希望在对已冇的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数拯分析工具很难对数据进行深层次的处理,使得人们只能望“数”兴叹。数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。数据挖掘通过在大量数据的基础上对各种学****算法的训练,得到数据对象间的关系模式,这些模式反映了数据的内在特性,是对数据包含信息的更高层次的抽彖[1]。目前,在需要处理大数据量的科研领域屮,数据挖掘受到越来越多的关注,同时,在实际问题中,大量成功运用数据挖掘的实例说明了数据挖掘对科学研究具有很大的促进作用。数据挖掘可以帮助人们对大规模数据进行高效的分析处理,以节约时间,将更多的精力投入到更高层的研究屮,从而捉高科研工作的效率。二、知识获取与数据挖掘—般说來,知识获取(KnowledgeDiscoveryinDatabases,称称KDD)意为数据库中知识获取,它代表从低层次数据中提取高层次知识的全过程,包括数据信息的收集,数据原型的确定,相关函数的分析,知识的抽取和数据模式分析。统计学屮常指的是无假设证实所进行的数据测量和分析。而数据挖掘则是指从数据中自动地抽取模型。数据挖掘包括许多步骤:从大规模数据库屮(或从其他来源)取得数据;选择合适的特征属性;挑选合适的样本策略;剔除数据中不正常的数据并补足不够的部分;用恰当的降维、变换使数据挖掘过程与数据模型相适合或相匹配;辨别所得到的是否是知识则需将得到的结果信息化或可视化,然后与现有的知识相结合比较。这些步骤是从数据到知识的必由之路。毎一步骤都可能是成功