1 / 13
文档名称:

大数据-数据挖掘课件.ppt

格式:ppt   大小:4,298KB   页数:13页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据-数据挖掘课件.ppt

上传人:bai1968104 2020/8/12 文件大小:4.20 MB

下载得到文件列表

大数据-数据挖掘课件.ppt

相关文档

文档介绍

文档介绍:大数据vs数据挖掘大数据是什么大数据(bigdata,megadata),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据与云计算的关系就像一枚硬币的正反面一样密不可分。HACE定理:大数据是巨大,无中心循环自生的,关系复杂且变化的。1998:BigDataandtheNextWaveof…2005::GoogleAnalytic2012:FacebookIPO大数据的纬度数据技术创意数据挖掘是什么数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。各种来源数据数据库或者数据仓库数据挖掘引擎模式评估用户界面知识库数据挖掘能挖掘什么概念性描述:用户画像;频繁模式,关联:推荐系统;分类;聚类:寻找新的分类;离群点分析:演变分析,时间序列:预测未来。易于理解,有效,有用,新的。数据库技术统计学信息科学可视化机器学习数据挖掘DMQL:与任务相关的数据;要挖掘的知识类型;用于挖掘过程的背景知识;评估模式的兴趣度度量和阈值;可视化发现模式的期望表示CRISP-,虚线为预测部分整体vs个体关注个体间的关系,集体表现特性。关注关联关系,注重实际应用,不追究因果关系。个体间通常有很多的联系,交互。关注个体的细节,数据由什么构成。关注因果关系,注重理论知识。根据实验理论,个体间彼此是分离的。多样vs抽样关注一切可能获取的数据,考虑数据全部。数据可以多次被使用,陈旧数据不会删除。非结构化,无层次。采用分布式部署。数据一般人工收集而来,按照一定的规则进行抽样。陈旧数据一般不使用,为节约空间一般会以别的形式存放。数据是规范的,有层次。一般是单机。简单算法vs专家参与对先验知识的依赖性低,基本不需要人工参与。对大量数据实施简单算法。能自动调整适应。严重依赖于先验知识和数据挖掘者的经验。算法复杂:概率算法,神经网络等。会出现滚雪球的灾难。

最近更新

医院工作年终个人总结(3篇) 13页

2025年HPV病毒感染真相揭秘 27页

人教版五年级英语上册先学后教带录音U 16页

员工年终总结发言稿范文汇总(12篇) 33页

商标侵权投诉书(3篇) 11页

土地租赁经营合同书范本(7篇) 21页

大学三好学生个人总结(12篇) 13页

人教版九年级化学第三单元课件 17页

学校迎新晚会主持人开场白(9篇) 9页

2025年疫情动态与紧急事件速报 45页

2025年流行性腮腺炎疫情发展与防治策略 52页

2025年梅毒防治知识普及讲座 62页

2025年慢性肾功能不全深度解析 60页

2025年心脏瓣膜置换术后康复指南 26页

2025年婴儿心理发展奥秘探析 50页

二零二五年度企业宣传影片制作及宣传推广合同.. 9页

二零二五年度企业团建旅游度假村入住服务合同.. 9页

二零二五年度企业员工自驾车辆租赁合作协议 8页

二零二五年度企业员工生日礼金补贴协议 7页

2025年卫生法学核心原理解读 64页

二零二五年度企业员工劳动合同模板示范 8页

二零二五年度企业员工个人车位租赁合同电子版.. 8页

二零二五年度企业单方面变更劳动合同与职业培.. 7页

二零二五年度企业内部培训与员工发展顾问合同.. 9页

2025年北京友谊医院两天钜惠活动 30页

艺术舞蹈老师简历模板 1页

服装设计合作协议书 5页

煤炭资源地质勘查设计编写提纲 14页

硫酸铵生产硫酸钾的可行性方案 31页

2022年首都经济贸易大学工商管理专业《管理学.. 22页