1 / 11
文档名称:

R语言统计分析作业.docx

格式:docx   大小:80KB   页数:11页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言统计分析作业.docx

上传人:蓝天 2021/10/27 文件大小:80 KB

下载得到文件列表

R语言统计分析作业.docx

文档介绍

文档介绍:T<- ("G****文件夹/R语言/R语言作业/5/住房状况 " ,header=TRUE,sep=
1、对变量计划户型制作一张频数分布表,并绘制相应的图形,写出相应的 结论(请写出R代码)
table(T$计划户型)
> taol•仕$计划户型)
聲12
三宝两厅 三宜三厅 三宜一厅四空二厅双卫
223 5 208 37
更大户卫 两室两厅
21«1 13 104
四宝两厅单卫四宝三厅单卫四宝三厅双卫 19 2 €
2、请对变量计划面积选择正确的图形进行描述,写出相应的结论(请写出 R代码);
hist(T$计划面积,col = "lightgreen")
It R Sraphks: Device 2 (ACTIVE)
Histogram of 丁$计划面积
80 ool OS 0
Aouanbffu-
0 50 100 150 200 250 300
T$计划面枳
3、对变量计划面积,计算样本数、平均值、中位数、修剪均值、样本标准 差、偏态系数、峰态系数、最大值、最小值、上下四分位数,并对计划面积的 分布特征进行综合分析(请写出R代码);
t<-(T$ 计划面积)
summary(t)
library("psych")
describe(t)
根据第二题的直方图显示,计划面积的数据分布是非对称分布,
其中位数为100,,,下四分位数
,
4、请选用合适的图形来展示变量计划户型和变量从业状况之间的关系,并 进行独立性检验;(请写出R代码);
t<- (T)
b<-(t$从业状况,t$计划户型)
a<-table(b)
barplot(a,main="从业状况与计划户型的关系",ylab="频数
",col=c(rainbow(6)),beside=TRUE)
summary(assocstats(a))
Ho:计划户型与从业状况独立,即两个变量不关联;Hi:计划户
型与从业状况不独立,即两个变量关联;
Pearson 卡方检验结果表明,a=719, X-squared = , df = 50,
p-value = -09,小于 ,拒绝原假设,Cramefs V = ,有
证据表明计划户型与从业状况不独立。
J从业状况
大专魄校科硏草位 国菁企业
行政事业单位 其它
夫业
私善企业
22两宜两厅两宝一厅三宝两厅三宝三亍三宜一厅四空二厅取卫四京两厅•卫四宜三厅11卫四宜三厅双卫一皇一厅 0 2 0 0 10
28
0
3
1S
37
0
1 0
0
0
0
5、请选用合适的图形来展示变量户口状况和变量现住面积之间的关系;如 果想分析变量户口状况是否对变量现住面积产生显著性影响,应该采取哪种统 计分析方法?户口状况是否对变量现住面积产生显著性影响?为什么?(请写 出R代码)
c<-(T$户口状况,T$现住面积)
boxplot(T$现住面积~T$户 口状况,data=c,ylab="现住面积",xlab=" 户 口状况",varwidth=TRUE,col="red2")
如果想分析变量户口状况是否对变量现住面积产生显著性影响:
(1) 首先,现住面积是大样本数据,检验方差齐性时可以使用 Levene检验,分析本市户口人民的现住面积与外地户口人民的现住 面积之间的总体方差是否有显著性差异。根据R输出结果,F = , p-value =, p-,拒绝原假设;有证据表明本市 户口人民的现住面积与外地户口人民的现住面积之间的总体方差存 在显著差异。
leveneTest(T$现住面积〜T$户口状况,data=T)
library("car
戟入程辑包x 'car*
The following object is masked from 'package:psych*:
logi t
leveneTest (T$现住面积~T$户口状況,data-T)
leveneTest任$现住面积户□扶
Levene's Test for Homogeneity of Variance (center ■ median)
Df F value Pr(>F)
group 1 5・4041 0・02016 *
2991
Signif・ codrs: 0 ***** '*** *** 、・• 0・l 、・ 1
>