1 / 45
文档名称:

《大数据》PPT之六第5章R语言.pptx

格式:pptx   大小:5,897KB   页数:45页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

《大数据》PPT之六第5章R语言.pptx

上传人:feng1964101 2019/4/17 文件大小:5.76 MB

下载得到文件列表

《大数据》PPT之六第5章R语言.pptx

相关文档

文档介绍

文档介绍:全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用大数据刘鹏主编张燕张重生张志立副主编BIGDATA刘鹏教授,清华大学博士。现任南京大数据研究院院长、中国信息协会大数据分会副会长、中国大数据技术与应用联盟副理事长。主持完成科研项目25项,发表论文80余篇,出版专业书籍15本。获部级科技进步二等奖4项、三等奖4项。主编的《云计算》被全国高校普遍采用,被引用量在国内计算机图书类排名居前。创办了知名的中国云计算()和中国大数据()网站。曾率队夺得2002PennySort国际计算机排序比赛冠军,两次夺得全国高校科技比赛最高奖,并三次夺得清华大学科技比赛最高奖。荣获“全军十大学****成才标兵”(排名第一)、南京“十大杰出青年”、江苏省中青年科学技术带头人、清华大学“学术新秀”等称号。第五章 SparkR全国高校标准教材《云计算》姊妹篇,《大数据》配套PPT课件用于统计计算和作图的语言计量经济学实证金融学统计遗传学等免费、《大数据》配套PPT课件基于S语言的一个GNU项目,语法来自Scheme语言,R语言的源代码正式发布到自由软件协会的FTP上核心开发团队达到20人,来自牛津大学、AT&T实验室等等。不单是一门语言,更是一个数据计算与分析的环境,内容涵盖了从统计计算到机器学****从金融分析到生物信息,从社会网络分析到自然语言处理,《大数据》,(其向量、矩阵运算方面功能尤其强大)完整连贯的统计分析工具优秀的统计制图功能R语言是一套完整的数据处理、计算和制图软件系统,《大数据》配套PPT课件丰富的数据读取和存储能力可以保存和加载R语言的数据,()函数和load()(()()函数)能够导入SPSS/SAS/Matlab等数据集可以通过RODBC接口,《大数据》配套PPT课件丰富的数据处理功能数据挖掘中,需要花70%以上的时间在数据处理上,R语言提供丰富的数据处理功能筛选filter()按给定的逻辑判断筛选出符合要求的子数据集排列arrange()按给定的列名依次对行进行排序选择select()用列名作参数来选择子数据集变形mutate()或transformation()用来进行列变形汇总summarise()进行汇总操作,返回一维结果分组分组动作group_by()《大数据》配套PPT课件丰富的数据处理能力向量因子数组矩阵列表R语言处理数据的最基本单位是向量,而不是原子数据R语言定义了一类非常特殊的数据类型:因子数组是向量和矩阵的直接推广,是由三维或三维以上的数据构成的较复杂的继承关系,和数组的关系既是父亲又是儿子,还是孙子列表由向量直接派生而来数据框可以将几个不同类型但长度相同的向量合并到一个数据框特殊值数据定义了如NULL、NA、NaN、《大数据》