文档介绍:R语言与统计分析
R语言与统计分析
2
什么是R?
The R Project for Statistical Computing
主页:
Getting Started
R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. To download R, please choose your preferred CRAN mirror.
If you have questions about R like how to download and install the software, or what the license terms are, please read our answers to frequently asked questions before you send an email.
R语言与统计分析
3
简 史
R语言是从S统计绘图语言演变而来,可看作S的“方言”。
S语言上世纪70年代诞生于贝尔实验室,由Rick Becker, John Chambers, Allan Wilks开发。
基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,在国外学术界应用很广。
1995年由新西兰Auckland大学统计系的Robert Gentleman和Ross Ihaka,基于S语言的源代码,编写了能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。
R语言与统计分析
R与统计简介
很多人都把R作为一个统计系统来使用。我们倾向于把它当作环境,使得经典和现代统计技术在其中得到应用。一部分语句和程序已经被内建在基本的R语言环境中,但是更多的是以包的形式提供的。由8个包是随着R一同提供的(称作标准包),其它的可以通过CRAN的成员网站获得(通过)。通过R可以使用绝大多数的经典或者最新的统计方法,不过用户需要花一些功夫来找出这种方法。
R与其他主流的统计系统在本质上有一个很重要的不同。在R中,统计分析通常由一系列的步骤完成,同时将交互的结果存储在对象中。所以,尽管SAS和SPSS在一个回归或者判别分析中会给出丰富的输出结果,R只是给出一个最小的输出,而将结果保存在一个适当的对象中由R函数进行后续查询。
R语言与统计分析
5
R源程序
R社区
R核心团队
R刊物
R书籍
R会议
R主页User Groups,中文社区-统计之都
国际—useR!;中国-COS(Chat Open Share)
上百种,包括统计编程,统计模型,数据分析,统计图示,以及for Bioinformatics……
The R Journal,Volume 4/2, June 2012
20位,牛津大学、AT&T实验室等
累计更新了95个版本
1997年959K——>2013年,24M
R语言与统计分析
6
R的特点
多领域的统计资源
目前在R网站上约有2400个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。
跨平台
R可在多种操作系统下运行,如Windows、MacOS、多种Linux和UNIX等。
命令行驱动
R即时解释,输入命令,即可获得相应的结果。
R语言与统计分析
7
为什么选择R?
丰富的资源
涵盖了多种行业数据分析中几乎所有的方法。
良好的扩展性
十分方便得编写函数和程序包,跨平台,可以胜任复杂的数据分析、绘制精美的图形。
完备的帮助系统
每个函数都有统一格式的帮助,运行实例。
GNU软件
免费、软件本身及程序包的源代码公开。
R语言与统计分析
8
R与其他统计软件比较
SAS:
速度快,有大量统计分析模块,可扩展性稍差,昂贵。
SPSS:
复杂的用户图形界面,简单易学,但编程十分困难。
Splus:
运行S语言,具有复杂的界面,与R完全兼容,昂贵。
……
R语言与统计分析
9
R的缺点
用户需要对命令熟悉
与代码打交道,需要记住常用命令。
占用内存
所有的数据处理在内存中进行,不适于处理超大规模的数据。
运