1 / 28
文档名称:

R语言实验报告.doc

格式:doc   大小:52KB   页数:28页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言实验报告.doc

上传人:raojun00001 2018/3/22 文件大小:52 KB

下载得到文件列表

R语言实验报告.doc

文档介绍

文档介绍:R语言实验报告

篇一:R语言判别分析实验报告
R语言判别分析实验报告
班级:应数1201
学号:12404108 姓名:麦琼辉
时间:2014年11月28号
1 实验目的及要求
1) 了解判别分析的目的和意义;
2) 熟悉R语言中有关判别分析的算法基础。
2 实验设备(环境)及要求
个人计算机一台,装有R语言以及RStudio并且带有MASS包。
3 实验内容
企业财务状况的判别分析
4 实验主要步骤
1) 数据管理:实验对21个破产的企业收集它们在前两年的财务数据,对25个财务良好的企业也收集同一时期的数据。数据涉及四个变量:CF_TD(现金/总债务);NI_TA(净收入/总资产);CA_CL(流动资产/流动债务);CA_NS(流动资产/净销售额),一个分组变量:企业现状(1:非破产企业,2:破产企业)。
2) 调入数据:对数据复制,然后在RStudio编辑器中执行如下命令。
case5=(‘clipboard’,head=T)
head(case5)
3) Fisher判别效果(等方差,线性判别lda):采用Bayes方式,即先验概率为样本例数,相关的RStudio程序命令如下所示。
library(MASS)
ld=lda(G~.,data=case5);ld #线性判别
ZId=predict(ld)
addmargins(table(case5$G,ZId$class))
4) Fisher判别效果(异方差,非线性判别--二次判别qda):再次采用Bayes
方式,相关的RStudio程序命令如下所示。
library(MASS)
qd=qda(G~.,data=case5);qd #二次判别
Zqd=predict(qd)
addmargins(table(case5$G,Zqd$class))
5 实验结果
表1 线性判别lda效果
新分类原分类 12 合计
1 24 1 25
2 3 18 21
合计 27 19 46
符合率 %
表2 二次判别qda效果新分类原分类 12 合计 1 24 1 25 2 2 19 21 合计 26 20 46 符合率 %
由表1和表2可知,qda(二次判别---非线性判别)的效果比lda(一次判别)要好。
6 实验小结
通过本次实验了解了判别分析的目的和意义,并熟悉R语言中有关判别分析的算法基础。
篇二:R语言实验报告
一、试验目的
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
本次试验要求掌握了解R语言的各项功能和函数,能够通过完成试验内容对R语言有一定的了解,会运用软件对数据进行分析。
二、试验环境
Windows系统,RGui(32-bit)
三、试验内容
模拟产生电商专业学生名单(学号区分),记录高数、英语、网站开发三科成绩,然后进行统计分析。假设有的100 名学生,起始学号为210222001,各科成绩取整,高数成绩为均匀分布随机数,都在75分以上。英语成绩为正态分布,平均成绩80,标准差为7。网站开发成绩为正态分布,平均成绩83,标准差为18。把正态分布中超过100分的成绩变成100分。
1 把上述信息组合成数据框,并写到文本文件中;
2计算各种指标:平均分,每个人的总分,最高分,最低分,(使用apply 函数) 3求总分最高的同学的学号
4绘各科成绩直方图、散点图、柱状图丶饼图丶箱尾图(要求指定颜色和缺口) 5画星相图,解释其含义 6画脸谱图,解释其含义, 7画茎叶图、qq图
四、试验实现
(一) 按要求随机生成学号,和对于的高数、英语、网站开发三科成绩。 A、生成学号 B、生成高数成绩
高数成绩要求:高数成绩为均匀分布随机数,都在75分以上均匀分布函数:runif(n,min=0,max=1) 其中,n 为产生随机值个数(长度),min为最小值,max为最大值。
C、生成英语成绩
英语成绩要求:正态分布,平均成绩80,标准差为7 正态分布函数:rnorm(n, mean = 0, sd = 1) 其中,n 为产生随机值个数(长度),mean 是平均数, sd 是标准差。
1
D、生成网站开发成绩
网站开发成绩要求:网站开发成绩为正态分布,平均成绩83,标准差为18。其中大于100的都记为100。
(二) 把上述信息组合成数据框,并写到文本文件中; 计算各种指标:平均分,每个人的总分,最
高分,最