1 / 16
文档名称:

R语言统计分析作业.docx

格式:docx   大小:310KB   页数:16页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言统计分析作业.docx

上传人:ocxuty74 2021/11/23 文件大小:310 KB

下载得到文件列表

R语言统计分析作业.docx

文档介绍

文档介绍:精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 1 页
T<- ("G:/学****文件夹/R语言/R语言作业/5/",header=TRUE,sep=",")
1、对变量计划户型制作一张频数分布表,并绘制相应的图形,写出相应的结论(请写出R代码)
table(T$计划户型)
2、请对变量计划面积选择正确的图形进行描述,写出相应的结论(请写出R代码);
hist(T$计划面积, col = "lightgreen")
3、对变量计划面积,计算样本数、平均值、中位数、修剪均值、样本标准差、偏态系数、峰态系数、最大值、最小值、上下四分位数,并对计划面积的分布特征进行综合分析(请写出R代码);
t<-(T$计划面积)
summary(t)
library("psych")
精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 3 页
describe(t)
根据第二题的直方图显示,计划面积的数据分布是非对称分布,其中位数为100,,,,
4、请选用合适的图形来展示变量计划户型和变量从业状况之间的关系,并进行独立性检验;(请写出R代码);
t<- (T)
b<-(t$从业状况,t$计划户型)
a<-table(b)
barplot(a,main="从业状况与计划户型的关系",ylab="频数",col=c(rainbow(6)),beside=TRUE)
summary(assocstats(a))
H0:计划户型与从业状况独立,即两个变量不关联;H1:计划户型与从业状况不独立,即两个变量关联;
Pearson卡方检验结果表明,n=719,X-squared = , df = 50, p-value = -09,, 拒绝原假设,Cramer′s V = ,有证据表明计划户型与从业状况不独立。
精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 3 页
5、请选用合适的图形来展示变量户口状况和变量现住面积之间的关系;如果想分析变量户口状况是否对变量现住面积产生显著性影响,应该采取哪种统计分析方法?户口状况是否对变量现住面积产生显著性影响?为什么?(请写出R代码)
c<-(T$户口状况,T$现住面积)
boxplot(T$现住面积~T$户口状况,data=c,ylab="现住面积",xlab="户口状况",varwidth=TRUE,col="red2")
如果想分析变量户口状况是否对变量现住面积产生显著性影响:
(1)首先,现住面积是大样本数据,检验方差齐性时可以使用Levene检验,分析本市户口人民的现住面积与外地户口人民的现住面积之间的总体方差是否有显著性差异。根据R输出结果, F = , p-value =,p-,拒绝原假设;有证据表明本市户口人民的现住面积与外地户口人民的现住面积之间的总体方差存在显著差异。
leveneTest(T$现住面积~T$户口状况,data=T)
精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 4 页
(2)本研究使用了独立样本t检验方法,分析本地户口人民的现住面积和外地户口人民的现住面积之间是否存在显著差异。
(T$现住面积~T$户口状况,data=T)
cohensD(现住面积~户口状况,data=T,method="unequal")
由于t=,d=,df =,p值=,,所以拒绝原假设。有证据表明本地户口人民的现住面积和外地户口人民的现住面积之间存在显著差异。但本案例的效应不大。
精品文档,仅供学****与交流,如有侵权请联系网站删除
【精品文档】第 5 页
6、如果想分析变量文化程度是否对变量家庭收入产生显著性影响,应该采取哪种统计分析方法?文化程度是否对变量家庭收入产生显著性影响?为什么?(请写出R代码)
attach(T)
(家庭收入[文化程度=="初中及以下"])
(家庭收入[文化程度=="大学(专、本科)"])
(家庭收入[文化程度=="高中(中专)"])
(家庭收入[文化程度=="研究生及以上"])
原假设:文化程度为“初中及以下”时的家庭收入来自