1 / 64
文档名称:

大数据分析方法及工具应用-大数据分析法课件.ppt

格式:ppt   大小:7,578KB   页数:64页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据分析方法及工具应用-大数据分析法课件.ppt

上传人:ogthpsa 2022/8/17 文件大小:7.40 MB

下载得到文件列表

大数据分析方法及工具应用-大数据分析法课件.ppt

文档介绍

文档介绍:大数据分析及工具应用
*
目录
*
数据分析即从数据、信息到知识的过程,数据分析需要数学理论、行业经验以及计算机工具三者结合
数学&统计学知识
数据分析的基础,将整理、描述、预测数据的手段、过程抽象为数学模型的理大数据分析及工具应用
*
目录
*
数据分析即从数据、信息到知识的过程,数据分析需要数学理论、行业经验以及计算机工具三者结合
数学&统计学知识
数据分析的基础,将整理、描述、预测数据的手段、过程抽象为数学模型的理论知识
工具支撑
各种厂商开发了数据分析的工具、模块,将分析模型封装,使不了解技术的人也能够快捷的实现数学建模,快速响应分析需求。
行业经验
行业经验可在数据分析前确定分析需求,分析中检验方法是否合理,以及分析后指导应用,但行业特征不同,其应用也不同,因此本文不展开介绍
传统分析
在数据量较少时,传统的数据分析已能够发现数据中包含的知识,包括结构分析、杜邦分析等模型,方法成熟,应用广泛,本文不展开介绍
分析误区
不了解分析模型的数学原理,会导致错误的使用模型,而得出错误的分析结论,影响业务决策,因此在选用分析模型时,要深入了解该模型的原理和使用限制
机器学****br/>不需要人过多干预,通过计算机自动学****发现数据规律,但结论不易控制。
数据挖掘
数据挖掘是挖掘数据背后隐藏的知识的重要手段
*
随着计算机技术发展和数据分析理论的更新,当前的数据分析逐步成为机器语言、统计知识两个学科的交集(备选)
计算机技术
统计学、人工智能
业务数据
数据挖掘
就是充分利用了统计学和人工智能技术的应用程序,并把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。
信息处理
信息处理
信息处理基于查询,可以发现有用的信息。但是这种查询的回答反映的是直接存放在数据库中的信息。它们不反映复杂的模式,或隐藏在数据库中的规律。
传统分析
数据分析
工具
传统分析
在数据量较少时,传统的数据分析已能够发现数据中包含的知识,包括结构分析、杜邦分析等模型,方法成熟,应用广泛,本文不展开介绍
数据分析工具
各种厂商开发了数据分析的工具、模块,将分析模型封装,使不了解技术的人也能够快捷的实现数学建模,快速响应分析需求。
*
目录
概述
*
(business understanding)
确定目标、明确分析需求
(data understanding)
收集原始数据、描述数据、探索数据、检验数据质量
(data preparation)
选择数据、清洗数据、构造数据、整合数据、格式化数据
(modeling)
选择建模技术、参数调优、生成测试计划、构建模型
(evaluation)
对模型进行较为全面的评价,评价结果、重审过程
(deployment)
分析结果应用
数据分析标准流程
CRISP-DM为90年代由SIG组织(当时)提出,已被业界广泛认可的数据分析流程。
*
数据分析框架
业务理解
数据理解
数据准备
建立模型
理解业务背景,评估分析需求
模型评估
应用
理解业务背景:
数据分析的本质是服务于业务需求,如果没有业务理解,缺乏业务指导,会导致分析无法落地。
评估业务需求:
判断分析需求是否可以转换为数据分析项目,某些需求是不能有效转换为数据分析项目的,比如不符合商业逻辑、数据不足、数据质量极差等。
数据收集
数据清洗
数据收集:
抽取的数据必须能够正确反映业务需求,否则分析结论会对业务将造成误导。
数据清洗:
原始数据中存在数据缺失和坏数据,如果不处理会导致模型失效,因此对数据通过过滤“去噪”从而提取出有效数据
数据探索
数据转换
选择方法、工具,建立模型
建模过程评估
模型结果评估
分析结果应用
分析模型改进
探索数据:
运用统计方法对数据进行探索,发现数据内部规律。
数据转换:
为了达到模型的输入数据要求,需要对数据进行转换,包括生成衍生变量、一致化、标准化等。
建立模型:
综合考虑业务需求精度、数据情况、花费成本等因素,选择最合适的模型。
在实践中对于一个分析目的,往往运用多个模型,然后通过后续的模型评估,进行优化、调整,以寻求最合适的模型。
建模过程评估:
对模型的精度、准确性、效率和通用性进行评估。,
模型结果评估:
评估是否有遗漏的业务,模型结果是否回答了当初的业务问题,需要结合业务专家进行评估。
结果应用:
将模型应用于业