1 / 34
文档名称:

大数据时代下的数据挖掘简易学习教案.ppt

格式:ppt   大小:1,409KB   页数:34页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据时代下的数据挖掘简易学习教案.ppt

上传人:wz_198613 2022/1/3 文件大小:1.38 MB

下载得到文件列表

大数据时代下的数据挖掘简易学习教案.ppt

相关文档

文档介绍

文档介绍:会计学
*
大数据(shùjù)时代下的数据(shùjù)挖掘简易
第一页,共34页。
大数据开启(kāiqǐ)了一次重大的时代转型。就想望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……
一场(yī chǎnɡ)生活、工作与思维的大变革
第1页/共33页
第二页,共34页。
一场生活、工作(gōngzuò)与思维的大变革
大数据,变革公共卫生(ɡōnɡ ɡònɡ wèi shēnɡ)
大数据,变革商业
大数据,变革思维
大数据,开启重大的时代转型
预测,大数据的核心
大数据,大挑战
第2页/共33页
第三页,共34页。
什么(shén me)是大数据
2009年,甲型H1N1流感在全球爆发传播,为了发现和控制疫情,各国政府和卫生相关(xiāngguān)部门付出了巨大努力,但得到的数据仍然滞后一两周,而Google对人们的搜索的历史记录进行处理,建立合理的数学模型后,得到的预测结果与官方的数据相关(xiāngguān)性高达97%,能够立刻判断出流感是从哪里传播出来的,没有一两周的滞后。
Google处理了5000万条历史记录、亿个不同的数学模型。
第3页/共33页
第四页,共34页。
什么(shén me)是大数据
Farecast是一个对机票价格进行预测的公司,帮助消费者抓住最佳购买机票的时机,使乘客节省很多钱。
最初预测系统建立在41天之内的12000个价格样本基础上,数据是从旅游网站上抓取的,如今已经(yǐ jing)拥有超过2000亿条飞行记录。
系统只推测机票的价格何时最便宜,不关心是什么原因导致的价格下降。
Farecast→Bing
第4页/共33页
第五页,共34页。
大数据(shùjù)的特性
大数据(shùjù)
的特性
更关注(guānzhù)
相关性
主要用
于预测
数据量
巨大
实时性
要求高
第5页/共33页
第六页,共34页。
大数据时代(shídài)的思维变革
大数据时代(shídài)的商业变革
大数据时代(shídài)的管理变革
第6页/共33页
第七页,共34页。
第7页/共33页
第八页,共34页。
“更多”——不是随机样本,而是全体(quántǐ)数据
当数据处理技术已经发生翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马(qí mǎ)一样。一切都改变了,我们需要的是所有的数据,“样本=总体”。
让数据“发声”
小数据时代的随机采样,最少的数据获得(huòdé)最多的信息
全数据模式,样本=总体
第8页/共33页
第九页,共34页。
“更杂”——不是(bù shi)精确性,而是混杂性
执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是有框架(kuànɡ jià)且能适用于传统数据库的。如果不能接受混乱,剩下95%的非框架(kuànɡ jià)数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。
允许不精确
大数据的简单算法比小数据的复杂算法更有效
纷繁的数据越多越好
混杂性,不是竭力避免,而是标准途径(tújìng)
新的数据库设计的诞生
第9页/共33页
第十页,共34页。