文档介绍:R语言与统计分析
汤银才主编
高等教育出版社
二○○八年五月
内容介绍
本书以数据的常用统计分析方法为基础,在简明扼要地阐述统计学基本概
念、基本思想与基本方法的基础上,讲述与之相对应的R函数的实现,并通过
具体的例子说明统计问题求解的过程.
本书注重思想性、实用性和可操作性. 在内容的安排上不仅包含了基础统
计分析中的探索性数据分析、参数的估计与假设检验,还包括的非参数统计分
析的常用方法、多元统计分析方法及贝叶斯统计分析方法. 每一部分都通过具
体例子重点讲述解决问题的思想、方法和在R中的实现过程. 通过本书读者不
仅可以快速学会R的基本原理与核心内容,而且根据提供的例子与相应的R程
序学会解决问题的统计计算方法与基本的编程技术,为解决更为复杂的统计问
题奠定扎实的基础.
本书可作为各专业本科生、研究生数理统计或应用统计课程的基础教材
或实验教材,也可作为从事数据统计分析研究人员、工程技术人员的工具书或
参考读物.
I
前言
统计学的任务是研究有关收集、整理、分析数据,从而对所考察的问题作
出一定的结论的方法与理论. 作为一门科学,统计学有其坚实的理论基础,研
究统计学方法的理论基础问题的那一部分,构成了所谓数理统计学的内容。其
次,统计学就其本质来讲,是一门实用性很强的科学,它在人类活动的各个领
域有着广泛的应用。因此数理统计的理论与方法应该与实际相结合,解决社
会、经济、工农业生产、生物制药、航空航天、质量管理、环境资源等领域中的
各种问题。最后,统计学又是一门技术性很强的科学,由于所研究问题越来越
复杂、变量之间关联性越越强、数据的规模越来越大,使得原有的计算方法无
法实现. 现在,随着计算机的不断发展与普及,特别是近20年来统计计算的突
破性进展及统计软件的不断完善和成熟,使得解决这些问题不仅成为可能,而
且越来越容易、快速.
目前许多大学几乎所有的理工科,甚至文科的许多专业都开设了《数理
统计》或《应用统计》之类的课程,有的还编写了相应的教材,这是令人可
喜的. 这些课程与教材的共同特点是以较大的篇幅介绍数理统计的理论、方
法与实际背景,并配有一定数量的例子和习题. 部分学校还为有统计专业和
应用数学专业的学生开设SAS或Matlab统计软件,为经济统计专业的学生开
设SPSS或EViews统计软件, 但这还远远不够.
作者长期从事概率论与数理统计、统计计算及统计软件的教学工作,我
们发现目前的统计教学普遍存在的问题有:一、关于教学内容:在有限的课
时下,对于非统计专业的学生采用统计专业学生的教学方式,过多强调理论
的重要性,从而忽视了统计思想和数据处理能力的培养;有的因为仅用一学
期(54课时或更少)讲授概率论与数理统计,面面俱到的概率论教学使学生无法
学到诸如回归分析与方差分析的重要内容. 二、关于软件教学:由于没有软件
支持,使用传统的教学方法和教材,无论是老师讲解例题,还是学生完成习题
都要花费大量的时间进行手工计算,且错误率高. 使用软件可使数据分析更具
II 第零章内容介绍
直观性、灵活性和可重复性,可起到举一反三的作用,提高学生的学习兴趣和
动手(操作或编程)能力. 三、关于统计教学与软件教学是否分开: 统计教学与
软件教学分开教学会产生一定的重复性,从而浪费有限教学课时,降低学习的
效率. 分开的教学会使大部分非统计专业的学生不能得到统计软件操作和数
据分析能力的培养. 有了统计软件, 可大大增加教学的信息量、节省时间用于
培养学生统计软件的上机操作能力;有了统计软件,使得大规模或海量数据
分析和精确计算成为可能,也使教材中的许多附表(如常用分布的分位数表)失
去其必要性. 四、关于R软件: 本书之所以采用R软件, 主要原因是其强大的数
据的图形展示和统计分析功能、免费使用和更新及大量可随时加载的有针对
性的软件包. 而SAS、Matlab、SPSS、EViews却都是收费软件,与R功能几乎相
同的S-PLUS也是收费的. R高效的代码、简洁的输出和强大的帮助系统使统
计软件辅助的统计教学成为可能. 基于R开发的菜单式驱动的图形界面工具R
Commander和PMG(见附录B)使得基础统计分析像SPSS一样容易实现.
本书介绍了R的基本功能、常用的数据处理与分析方法及它们在R中的实
现. 全书共分十一章及三个附录: 第一章, R 介绍. 介绍了R软件的功能与安
装. 第二章, R的基本原理与核心. 简明扼要地介绍了R软件的使用方法, 主
要侧重于不同类型的数据的操作与函数的使用. 第三章, 概率与分布. 介绍了
常用的离散与连续型分布及