1 / 55
文档名称:

R语言CH7-统计回归分析课件.pptx

格式:pptx   大小:1,981KB   页数:55页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言CH7-统计回归分析课件.pptx

上传人:gxngqvk 2022/7/26 文件大小:1.93 MB

下载得到文件列表

R语言CH7-统计回归分析课件.pptx

相关文档

文档介绍

文档介绍:《R语言基础与数据科学应用》
沈刚 主编
人民邮电出版社
第七章 统计回归分析
内容导航
CONTENTS
数据的数值度量
定性与定量数据
概率分布与假设检验


《R语言基础与数据科学应用》
沈刚 主编
人民邮电出版社
第七章 统计回归分析
内容导航
CONTENTS
数据的数值度量
定性与定量数据
概率分布与假设检验



回归分析

定性数据
如果一个样本的取值属于一组已知的且互不重叠的类型,我们把这样的数据样本被称为定性数据,也称作分类数据。
iris数据是R自带的内置数据集之一,其中的鸢尾花分类信息就是一个定性数据的实际例子。
> str(iris)
'': 150 obs. of 5 variables:
$ : num 5 5 ...
$ : num 3 ...
$ : num ...
$ : num ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
定性数据
该数据集的最后一列是属性Species,包含了对鸢尾花品种的分类。品种的名称分别用setosa、versicolor、virginica等不同级别的因子来表示,这就是一个定性数据的例子。
> iris$Species
[1] setosa setosa setosa setosa setosa setosa
[7] setosa setosa setosa setosa setosa setosa

[145] virginica virginica virginica virginica virginica virginica
Levels: setosa versicolor virginica
定性数据
数据变量的频数分布是对数据在一组不重叠的类别中出现次数的概括。
> species <- iris$Species
> <- table(species);
species
setosa versicolor virginica
50 50 50
相对频数=频数/样本总数
> <- / nrow(iris)
>
species
setosa versicolor virginica

定性数据
使用柱状图可视化频数信息
> barplot()
使用饼状图可视化频数信息
> pie()
自定义饼图颜色
> colors = c("red", "yellow", "blue")
> pie(, col=colors)
定性数据
> species <- iris$Species
> s_species <- species == "setosa"
> s_iris <- iris[s_species, ]
> options(digits=3)
> mean (s_iris$)
[1]
> tapply (iris$, iris$Species, mean)
setosa versicolor virgi