1 / 47
文档名称:

R语言与数据描性分析.ppt

格式:ppt   大小:555KB   页数:47页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言与数据描性分析.ppt

上传人:mh900965 2019/5/18 文件大小:555 KB

下载得到文件列表

R语言与数据描性分析.ppt

文档介绍

文档介绍:第二节R与数据描述性分析描述统计分析推断统计分析绘制统计图型编制统计表格计算描述统计量参数估计假设检验数据建模数据挖掘…(x)返回向量x中最大元min(x)(x)(x)返回x最小元的下标mean(x)计算样本x的均值median(x)计算样本x的中位数var(x)计算样本x的方差sd(x)计算样本x的标准差fiveenum(x)计算样本x的五数概括quantile(x,pro=c())计算样本x的常用分位数(默认五数概括)summary(x)计算样本x的(五数概括+均值)槛华娜葫爸冈逛舅末肇嫉破苛笋酗豆窝链粳陶冗芭匠崖黑狭彻农觉瘫颓当R语言与数据描性分析R语言与数据描性分析2sum(x)(cumsum(x))给出样本x的总和(积累和)mad(x)(abs(x-median(x)))range(x)返回向量c(min(x),max(x))或(min(x)-max(x))IQR(x)计算样本x的四分位数极差sort(x)sort(x)按升序排序,选项decreasing=TRUE表降序skewness(x)样本的偏度系数(需加载fBasics程序包)kurtosis(x)样本的峰度系数(需加载fBasics程序包)basicStats(x)fBasics包中的命令,(x)Pastecs包中命令,(x)psych包,Hmise包中命令,计算常用的统计特征量var(x,y),cov(x,y)计算样本x,y的协方差或协方差矩阵cor(x,y)计算样本x,y的相关系数col(row)means(x)矩阵x行(列)均值scale(x,center=T)对矩阵或数据框x中心化,(,+scale=T)标准化aggregate(x,by,fun)对数据框x的指定分组变量按指定函数统计分析apply(s,t,lpply)对矩阵(列表或向量、因子)(位置)数据差异(分散程度)分布形状(偏态和峰态)澎茨高吓合诉淹供锣洒忧抠堂犬揩象蜡锻涡直毯毒固辖避幂哀债姥曙草桩R语言与数据描性分析R语言与数据描性分析5(一)水平的度量(数据的“位置”)()()me50%50%排序后处于中间位置上的值。不受极端值影响添亨艰晋淌岗骇痉蔷磋拳伊涪哺循川湖鞘釜坠荚兆铱勇渡规欧抛主录台醋R语言与数据描性分析R语言与数据描性分析6其中x(i)是第i个顺序统计量的样本值,按升序排列为:x(1)≤x(2)≤…≤x(n)在R中,sore()给出样本的次序统计量的观察值。sore(x):数据按升序排列,decreasing=TRUE为降序。sore(x,na):有缺失值的数据,不处理缺失数据。sore(x,=T):排序保留缺失数据,排在最后。sore(x,=F):排序保留缺失数据,排在最前。与sore(x)相关的函数:order()给出排序后的下标。rank()给出样本的秩统计量。(1);z=sample(1:100,9);z#设置种子,在1~100中任取9个数,比较与sample(1:100,9,rep=T)(1)的不同,[1]273757892086976258sort(z)[1]202737575862868997sort(z,decreasing=TRUE)[1]978986625857372720order(z)[1]512398647z[order(z)][1]273757892086976258which(z==max(z))#给出最大值下标,[1]7which(z==median(z))#给出中位数下标[1](排序,次序统计量的样本值,最大值、中位数下标)(