1 / 48
文档名称:

R 数据导入和导出.doc

格式:doc   大小:341KB   页数:48页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R 数据导入和导出.doc

上传人:cchanrgzhouh 2020/8/6 文件大小:341 KB

下载得到文件列表

R 数据导入和导出.doc

相关文档

文档介绍

文档介绍:R数据的导入和导出这是从R中导入或导出数据的一个指导手册。。该文档译自R-(2007年11月26日)。丁国徽()译。本文档的一些发布信息放置在。ISBN3-900051-10-0Notes:说明Introduction:绪论Spreadsheet-likedata:电子表格类似的数据Importingfromotherstatisticalsystems:导入其它统计软件的数据Relationaldatabases:关系数据库Binaryfiles:二进制文件Connections:workinterfaces:网络接口ReadingExcelspreadsheets:读取Excel表格文件References:参考文献Functionandvariableindex:函数和变量索引Conceptindex:概念索引1绪论尽管大多数读者觉得统计分析非常有趣,但为统计分析读入数据以及把结果导出到其它系统以方便报表编写可能是一件比统计分析更花时间和难办的差事。本手册描述了R自身以及从CRAN获得的一些包里面的数据导入和导出功能。这里描述的一些包可能还正在开发,但它们已经提供了一些非常有用的功能了。除非特别说明,本手册中描述的所有功能可以在各种平台运行的R中使用。通常,如R一类的统计系统特别不适合处理大尺度的数据。其它一些系统在这方面可以比R作的好。本手册的部分要点是建议用户可以用其它系统做数据处理工作而不是用R里面重复的功能(例如,Therneau和Grambsch(2000)就提到他们喜欢在SAS里面进行数据处理,然后才用S的包survival进行数据分析)。现在,还有几个包允许用其它编程语言(如Java,perl和python)开发的函数直接整合进R代码里面。这样就可以更加方便地用这些语言的功能。(见Omegahat项目()的SJava,RSPerl和RSPython包,和来自CRAN的rJava包)值得注意到是R和S一样都来自Unix的小的可重用工具的传统,因此,在数据导入前和结果导出后用awk和perl等工具处理数据都是值得推崇的。Becker,Chambers&Wilks(1988,第9章)中的案例分析就是这样的一个例子。其中,在S数据输入前用Unix工具检验和处理数据。R自己也是采用这种策略,比如用perl而不是R处理自身的帮助文件数据库,。现在,传统的Unix工具被很广泛的使用,包括在Windows系统上。Imports:导入Exporttotextfiles:导出到文本文件中XML:。对于小型或中型的问题,这种格式都可以接受的。从文本文件导入数据的原始函数(primaryfunction)是scan。电子表格类似数据(Spreadsheet-likedata)一章中讨论的大多数比较便利的函数都是基于这个原始函数。但是,所有的统计顾问们对客户用软盘或光盘提交一些私有的二进制数据(比如,`Excel电子表格'或`SPSS文件')都比较熟悉。通常,可以做的最简单的事情是用原始软件把数据用文本文件导出(而统计顾问们为了这个目的会在他们电脑里面安装大多数常用的软件)。不过,这不会总是可能的1。在从其它统计软件中导入数据(Importingfromotherstatisticalsystems)一章中,我们会讨论一些可以在R里面直接读取这些文件的工具。对Excel电子表格,读取Excel电子表格(ReadingExcelspreadsheets)一章对可以获得的相关方法进行了总结。在很少的一些例子中,出于简洁和快速访问考虑,数据以二进制格式保存。这种情况下一个例子是我们已经见过几次的图像数据。它通常以二进制流的方式保存然后在内存里面呈现,而且可能在数据前面加个信息头。这种数据格式在二进制文件(Binaryfiles)和二进制连接(Binaryconnections)部分都有所讨论。对于大的数据库数据,通常要借助数据库管理系统(Databasemanagementsystem,DBMS)来处理。我们可以通过DBMS从数据库里面提取没有格式的文本文件,但是对于大多数这一类型的DBMS,我们可以直接通过R的包来实现数据提取操作:见关系数据库(Relationaldatabases)部分。workinterfaces)一章讨论。Footnotes[1]译者注:国外的软件破解版没有我们这么容易方便。还有,软件太大了,有时,也不愿安装。比如SPSS,SAS比R大多了。,但是实际操