文档介绍:大数据分析方法交流关于分析思想、流程与工具的探讨主要内容引言数据分析的工作框架数据分析的实施流程总结引言引言言数据必称“大”的时代交通大数据、旅游大数据、网购大数据2011年开始的各种各样的“V”:Volume、Variety、Velocity(Value、Veracity-真实性)各种全新的配套手段:存储(云);处理(并行);保护(安全性);分析(数据挖掘、机器学****潜力无限vs言过其实?创新为主vs传承为主?引言思考1:“大”数据,到底应该多大?量级不严格、范围不严格思考2:新方法,到底有多新?大多数传承传统方式新方法解决面窄思考3:新结论,到底多有价值?陈述事实多,推理结论少展示效果好,实践应用差总结:大数据更多是一种新的数据观充分认识数据的价值(潜力与局限)正确选择分析的方法引言零售数据分析:我们的优势1、拥有最精华的数据,产出结论有说服力 (大而全不一定是长处:收集成本高、筛选困难)2、时间长涵盖面广,便于比较分析我们需要仔细分析的是:想做什么能做什么怎样做数据分析的工作框架工作框架需要的结论:既想要也想得到的数据资源和分析方法大量扩充—右半边扩张分析对象理解和问题思考有所不足—左半边停滞最重要的还是商业思维需要得到的结论数据分析可以解决的内容大数据商业思维数据资源理解DeepUnderstanding分析方法洞察Insight前瞻Prospect工作框架充分扩展两个部分,首先代表:理解宏观问题给出系统假设将假设化简至可被数据分析其次,两项工作无法忽视:充分研究了解对象—我们想要知道什么 (发现问题)判断我们想要研究的问题是否有意义 (减少人力损耗)工作框架数据分析的六个阶段1、对研究对象主观的和客观的、整体的和局部的认识2、提出希望探索的宏观的问题(自由的或是有明确的)3、探讨分析这些问题并产生结论的价值4、为选出的研究问题提出充分的假设。5、将研究假设进行拆解、划分成为可定量分析的单元。6、结合数据资源和数据分析方法产生结论,验证假设及理论的扩展性。