文档介绍:该【[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述 】是由【wawa】上传分享,文档一共【44】页,该文档可以免费在线阅读,需要了解更多关于【[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据挖掘中的统计方法及其实践
朱建平
厦门高校经济学院支配统计系
*
TheStatisticalMethodforDataMiningandItsApplication
ZhuJianping
XiamenUniversity
*
教学目的
数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和学问的过程。它是涉及机器学习、模式识别、统计学、人工智能、数据库管理及数据可视化等学科的边缘学科。
用统计的观点看,它可以看成是通过计算机对大量的困难数据集的自动探究性分析。作为一种独立于应用的技术,一经出现立刻受到广泛的关注。
本课程从统计学的角度介绍该领域的全面状况,讲授好玩的数据挖掘技术和方法,并探讨应用和探讨方向。其目的是针对海量数据,让我们驾驭利用计算机分析数据、理解数据,并具有基于丰富的数据做出决策的实力。
Date
讲授的基本内容
随着计算机技术和电子数据获得方面的不断进展以及Internet和各种局域网的广泛普及,人们获得的数据正以前所未有的速度急剧增加,最近几十年产生了很多超大型数据库,遍及超级市场销售、银行存款、天文学、粒子物理、化学、医学以及政府统计等领域。
那么,如何从这些大型数据库中发觉有用的信息、模式和学问?如何开发有效的挖掘方法?已成为众多科技工作者共同关注的焦点。在过去几年,一个称为“数据挖掘”(DataMining)的新领域得到了快速发展,已在经济、商业、金融、天文等行业得到了成功的应用,在国际上掀起了一股空前的探讨热潮。
Date
本课程从统计学的观点动身,立足理论,着眼应用,在明确了数据挖掘定义和对象的基础上,从七个方面对数据挖掘的理论及统计方法和应用进行较为具体的介绍。
第一章介绍数据挖掘概况。讲授数据挖掘的定义,并以技术和商业的角度给出了数据挖掘的定义。在此基础上,澄清数据挖掘与学问发觉的关系,明确数据挖掘的对象。最终对数据分析提出一些思索。
其次章数据挖掘与统计学的关系。以数据挖掘的发展历史为线索,讲授数据挖掘领域探讨所取得成果,说明数据挖掘自身的特点,从中领悟到了数据挖掘与统计学的关系。以现代统计方法的基本思想,让学生相识到统计学在数据挖掘中所做的贡献,即统计方法在数据挖掘中强有力的作用。
Date
第三章介绍数据准备。在这一章将分析原始大型数据库的基本表述和特征,了解数据准备的不同技术,比较去除丢失值的不同方法,构造时间相关数据的统一表述方法,实现一些数据预处理技术。
第四章介绍Rough集的基本模型及有关概念。这一章讲授学问的分类观点和概念的边界观点,学问的约简和决策表的约简。以统计思想与Rough集理论相结合,介绍对事务性数据库的统计描述,对事务性数据库事务项及属性项压缩的方法,构建事务性数据库列联表示的模型的思想。并利用所介绍的方法进行实证分析。
第五章重点介绍数据挖掘中的聚类问题。讲授数据的排序与有向聚类问题。介绍聚类分析数据类型衍生的思想,并对聚类分析方法进行了比较和检验。让学生在实际应用中相识到其方法的牢靠性与稳定性。
Date
第六章介绍挖掘大型数据库中的关联规则。讲授关联规则的意义和量度,维布尔关联规则,多层关联规则,由关联规则到相关分析。另外,引入相应分析作为数据挖掘中关联规则的提升,介绍相应分析适应性检验的基本思想及方法,及相应分析适应性的分层量度方法。利用可视化方法对所多度相应分析方法进行了验证。
第七章理解一些其它的数据挖掘技术。模糊聚类、神经网络、时序稠密数据集的挖掘技术等。
为了满足实际的须要,我们将利用所讲授的方法,对某地区中国移动通讯用户消费数据库、某高校高校生隐形教化调查资料和上证指数收盘价信息进行剖析,以便让学生充分地领悟到数据挖掘的理论和实际价值。
Date
参考文献
Cios,.,Pedrycz,
Friedman,.,DataMiningandStatistics:What’sTheConnection?TechnicalReport,StanfordUniversity
Glymour,C.,,DataMiningandKnowledgeDiscovery1,11-28(1997)
Han,,:ConceptsandTechniques,HigherEducationPress,(2001)
Theresa,B.,Frederick,,A.,Information-TheoreticMeasuresofUncertaintyforRoughSetsandRoughRelationalDatabases,JournalofInformationSciences109(1998),pp185-195
Nelson,.,HighRangeResolutionRadarTargetClassification:ARoughSetApproach,PaperofPhD
Date
张尧庭,谢邦昌,朱世武,数据采掘入门及应用——从统计技术看数据采掘,中国统计出版社,北京,()
史忠植著,学问发觉,清华高校出版社,北京,()
刘同明等编著,《数据挖掘技术及其应用》,国防工业出版社,()
数据挖掘探讨组,数据挖掘的探讨历史和现状,:///
闪四清等译(MehmedKantardzic),数据挖掘——概念、模型、方法和算法,清华高校出版社,()
张银奎等译(Hand,D),数据挖掘原理,机械工业出版社,()
范明等译,统计学习基础——数据挖掘、推理与预料,电子工业出版社,()
Date
第一章数据挖掘概述
§
§
§
§
Date