1 / 44
文档名称:

[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述.ppt

格式:ppt   大小:1,496KB   页数:44页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述.ppt

上传人:wawa 2022/10/14 文件大小:1.46 MB

下载得到文件列表

[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述.ppt

文档介绍

文档介绍:该【[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述 】是由【wawa】上传分享,文档一共【44】页,该文档可以免费在线阅读,需要了解更多关于【[理学]厦门大学数据挖掘课件之第1章-数据挖掘概述 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据挖掘中的统计 方法及其实践
朱建平
厦门高校经济学院支配统计系
*
TheStatisticalMethodforDataMiningandItsApplication
ZhuJianping
XiamenUniversity
*
教学目的
数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和学问的过程。它是涉及机器学习、模式识别、统计学、人工智能、数据库管理及数据可视化等学科的边缘学科。
用统计的观点看,它可以看成是通过计算机对大量的困难数据集的自动探究性分析。作为一种独立于应用的技术,一经出现立刻受到广泛的关注。
本课程从统计学的角度介绍该领域的全面状况,讲授好玩的数据挖掘技术和方法,并探讨应用和探讨方向。其目的是针对海量数据,让我们驾驭利用计算机分析数据、理解数据,并具有基于丰富的数据做出决策的实力。
Date
讲授的基本内容
随着计算机技术和电子数据获得方面的不断进展以及Internet和各种局域网的广泛普及,人们获得的数据正以前所未有的速度急剧增加,最近几十年产生了很多超大型数据库,遍及超级市场销售、银行存款、天文学、粒子物理、化学、医学以及政府统计等领域。
那么,如何从这些大型数据库中发觉有用的信息、模式和学问?如何开发有效的挖掘方法?已成为众多科技工作者共同关注的焦点。在过去几年,一个称为“数据挖掘”(DataMining)的新领域得到了快速发展,已在经济、商业、金融、天文等行业得到了成功的应用,在国际上掀起了一股空前的探讨热潮。
Date
本课程从统计学的观点动身,立足理论,着眼应用,在明确了数据挖掘定义和对象的基础上,从七个方面对数据挖掘的理论及统计方法和应用进行较为具体的介绍。
第一章介绍数据挖掘概况。讲授数据挖掘的定义,并以技术和商业的角度给出了数据挖掘的定义。在此基础上,澄清数据挖掘与学问发觉的关系,明确数据挖掘的对象。最终对数据分析提出一些思索。
其次章数据挖掘与统计学的关系。以数据挖掘的发展历史为线索,讲授数据挖掘领域探讨所取得成果,说明数据挖掘自身的特点,从中领悟到了数据挖掘与统计学的关系。以现代统计方法的基本思想,让学生相识到统计学在数据挖掘中所做的贡献,即统计方法在数据挖掘中强有力的作用。
Date
第三章介绍数据准备。在这一章将分析原始大型数据库的基本表述和特征,了解数据准备的不同技术,比较去除丢失值的不同方法,构造时间相关数据的统一表述方法,实现一些数据预处理技术。
第四章介绍Rough集的基本模型及有关概念。这一章讲授学问的分类观点和概念的边界观点,学问的约简和决策表的约简。以统计思想与Rough集理论相结合,介绍对事务性数据库的统计描述,对事务性数据库事务项及属性项压缩的方法,构建事务性数据库列联表示的模型的思想。并利用所介绍的方法进行实证分析。
第五章重点介绍数据挖掘中的聚类问题。讲授数据的排序与有向聚类问题。介绍聚类分析数据类型衍生的思想,并对聚类分析方法进行了比较和检验。让学生在实际应用中相识到其方法的牢靠性与稳定性。
Date
第六章介绍挖掘大型数据库中的关联规则。讲授关联规则的意义和量度,维布尔关联规则,多层关联规则,由关联规则到相关分析。另外,引入相应分析作为数据挖掘中关联规则的提升,介绍相应分析适应性检验的基本思想及方法,及相应分析适应性的分层量度方法。利用可视化方法对所多度相应分析方法进行了验证。
第七章理解一些其它的数据挖掘技术。模糊聚类、神经网络、时序稠密数据集的挖掘技术等。
为了满足实际的须要,我们将利用所讲授的方法,对某地区中国移动通讯用户消费数据库、某高校高校生隐形教化调查资料和上证指数收盘价信息进行剖析,以便让学生充分地领悟到数据挖掘的理论和实际价值。
Date
参考文献
Cios,.,Pedrycz,
Friedman,.,DataMiningandStatistics:What’sTheConnection?TechnicalReport,StanfordUniversity
Glymour,C.,,DataMiningandKnowledgeDiscovery1,11-28(1997)
Han,,:ConceptsandTechniques,HigherEducationPress,(2001)
Theresa,B.,Frederick,,A.,Information-TheoreticMeasuresofUncertaintyforRoughSetsandRoughRelationalDatabases,JournalofInformationSciences109(1998),pp185-195
Nelson,.,HighRangeResolutionRadarTargetClassification:ARoughSetApproach,PaperofPhD
Date
张尧庭,谢邦昌,朱世武,数据采掘入门及应用——从统计技术看数据采掘,中国统计出版社,北京,()
史忠植著,学问发觉,清华高校出版社,北京,()
刘同明等编著,《数据挖掘技术及其应用》,国防工业出版社,()
数据挖掘探讨组,数据挖掘的探讨历史和现状,:///
闪四清等译(MehmedKantardzic),数据挖掘——概念、模型、方法和算法,清华高校出版社,()
张银奎等译(Hand,D),数据挖掘原理,机械工业出版社,()
范明等译,统计学习基础——数据挖掘、推理与预料,电子工业出版社,()
Date
第一章数据挖掘概述
§
§
§
§
Date

最近更新

教师聘用合同样本 6页

摩托车保险赔偿合同细则 6页

探索:合同转让中债务合同的法律保护问题 6页

工业厂房租赁合同续签合同模板 6页

车身设计指南――焊接工艺部分(ch) 18页

1万吨年固体磷酸一铵装置技术鉴定书 2页

房产开发融资居间服务3篇 52页

1957年春耕需用的几种小农具的产销情况分析 2页

12V240ZJ型柴油机水套加工工艺的确定 2页

100立升多层绝热低温容器的制造工艺 2页

建筑材料物流合作协议3篇 55页

鬼脸菩提种仁油提取工艺及GC-MS分析 3页

首钢水钢炼钢厂二准备车间LSG-A型滑动水口机构.. 3页

青藏冻结粉土与玻璃钢接触面本构模型研究 4页

语文版七年级语文上册《空城计》 24页

语文五年级上册作业本部分答案 29页

个人住房公积金贷款申报资料 14页

运营商在新时期的信息基础设施建设探讨 3页

载氰化物粉状活性炭微波再生影响因素研究 3页

路桥试验检测中存在缺点及解决方法研究 3页

超临界空冷机组启动疏放水处理方案探讨 3页

计算机财务管理 14页

试井裂缝评价方法在AS油田WY区块开发中的应用.. 3页

褐色酸奶中5-羟甲基糠醛测定方法探究 3页

蜗轮范成法加工的数控改造及应用 3页

药品生产车间晚间模式开发的讨论 3页

2025年度个人承包物业合同及智能家居系统安装.. 8页

2025年度XX小区分户计量供用热力合同服务协议.. 8页

自动化监测系统分析深基坑监测的可靠性 4页

聚乙烯超高压反应管管端螺纹的机械强度与载荷.. 3页