1 / 89
文档名称:

R语言入门数据特征描述.ppt

格式:ppt   大小:749KB   页数:89页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言入门数据特征描述.ppt

上传人:gumumeiying 2021/7/10 文件大小:749 KB

下载得到文件列表

R语言入门数据特征描述.ppt

文档介绍

文档介绍:实验目的
实验内容
学****如何应用R软件描述数据特征
1、方法简介
2、应用实例
3、实验作业
第八讲 数据特征的描述
R语言入门数据特征描述
§ 3 数据分布特征的测度
集中趋势的测度
§ 离散程度的测度
§ 偏态与峰态的测度
R语言入门数据特征描述
学****目标
1. 集中趋势各测度值的计算方法
2. 集中趋势各测度值的特点及应用场合
3. 离散程度各测度值的计算方法
4. 离散程度各测度值的特点及应用场合
偏态与峰态的测度方法
用R计算描述统计量并进行分析
R语言入门数据特征描述
数据分布的特征
集中趋势
(位置)
偏态和峰态
(形状)
离中趋势
(分散程度)
R语言入门数据特征描述
数据分布特征的测度
数据特征的测度
分布的形状
集中趋势
离散程度
众 数
中位数
均 值
离散系数
方差和标准差
峰 态
四分位差
异众比率
偏 态
R语言入门数据特征描述
§ 集中趋势的测度
一. 分类数据:众数
二. 顺序数据:中位数和分位数
三. 数值型数据:均值
四. 众数、中位数和均值的比较
R语言入门数据特征描述
集中趋势 (Central tendency)
一组数据向其中心值靠拢的倾向和程度
测度集中趋势就是寻找数据水平的代表值或中心值
不同类型的数据用不同的集中趋势测度值
低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据
R语言入门数据特征描述
众数 (mode)
出现次数最多的变量值
不受极端值的影响
一组数据可能没有众数或有几个众数
主要用于分类数据,也可用于顺序数据和数值型数据
R语言入门数据特征描述
众数 (不唯一性)
无众数 原始数据: 10 5 9 12 6 8
一个众数 原始数据: 6 7 9 8 7 7
多于一个众数 原始数据: 25 28 28 42 36 36
R语言入门数据特征描述
分类数据的众数 (例题分析)
不同品牌饮料的频数分布
饮料品牌
频数
比例
百分比(%)
可口可乐
旭日升冰茶
百事可乐
汇源果汁
露露
15
11
9
6
9





30
22
18
12
18
合计
50
1
100
解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值
在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即
Mo=可口可乐
R语言入门数据特征描述