文档介绍:r语言,数据分析《R语言游戏数据分析和挖掘》新书推荐
欢迎关注天善智能 ,我们是专注于商业智能BI,大数据,数据分析领域的垂直小区,学****问答、求职,一站式搞定!
对商业智能BI、大数据分析挖掘、机器学****python,R等数据领域感爱好的同学加微信:tstoutiao,邀请你进入数据兴趣者交流群,数据兴趣者们全部在这儿。
《R语言游戏数据分析和挖掘》新书上市已经有一个多月,各大网店都有销售。这是一部从大数据技术和游戏业务双重维度讲解怎样利用结果数据指导商业决议的实战性著作,乐逗游戏高级数据分析师撰写,是她近10年数据挖掘和分析经验的总结。数据是无价的,只有当数据被挖掘分析并帮助到企业的时候才是有价值的。传统的数据分析类图书重技术而轻业务,本书二者并重:技术方面,以游戏数据的挖掘和分析为关键,辐射游戏数据处理的各个步骤,系统讲解游戏数据挖掘和分析的技术、方法论和工具;业务方面,全部案例的讲解过程中全部对相关业务进行了关键解读,意在加深数据分析师对游戏业务的了解和思索,从而更加好地利用R语言技术处理游戏数据处理中的多种复杂问题。
很多读者担心自己没有R语言的基础是否适合此书,也有另外部分读者担心此书是否偏向游戏行业,不适合其它行业的数据分析师阅读。其实这些担忧全部是多虑的,本书分为基础篇、实战篇和提升篇三大篇章,初学者也能经过学****基础篇的知识掌握R语言使用技巧,包含R语言数据对象、数据导入、数据处理、初级绘图和高级绘图等知识;实战篇是经过数据挖掘技术,对用户和收入进行深度挖掘,这些实战案例的处理方案含有行业通用性,能够很好地将思绪移植到其它行业领域中;提升篇又分为rattle和shiny,rattle是一款优异的R语言数据挖掘工具,shiny是RStudio企业开发的一个网页app开发框架,能够快速搭建数据分析挖掘原型,让不懂前端知识的数据分析师也含有平台开发能力。
基础篇包含游戏数据分析理论、R常见技巧和绘图技巧,R基础软件下载安装、扩展包(package)的安装,并具体介绍了怎样将文本文件、excel文件、MySQL数据库数据、网络数据读入到R中,最终R三大绘图系统:base系统、lattice系统和ggplot系统的绘图技术和交互式绘图(rCharts包、recharts包、plotly包和其它基于HTMLWidgets包开发的交互包)。
实战篇包含数据处理技巧、路径行为分析、付费偏好深度挖掘已经多种分类算法的原理及R实现(KNN近邻、朴素贝叶斯、决议树、bagging、boosting、随机森林、人工神经网络和支持向量机等算法),并利用caret包进行十折交叉验证选择最优模型。比如在对付费用户偏好的深度挖掘中,针对游戏用户总结了几个常见的数据挖掘技术:
其中,关联规则分析是购物篮常常应用的一个挖掘技术,基于物品协同过滤的方法来对玩家进行TopN商品推荐是现在电商流行的推荐算法之一,并利用社会网络分析中的社群发觉技术研究用户购置物品的偏好。
在渠道用户质量分析一章中,书中借鉴时间管理理论中一个很主要的四象限法则,对渠道用户进行象限划分,进而研究不一样渠道的用户质量情况。书中利用Median-IQR方法分析ARPPU、AR