1 / 74
文档名称:

数据描述性分析.ppt

格式:ppt   页数:74页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据描述性分析.ppt

上传人:pk5235 2015/9/7 文件大小:0 KB

下载得到文件列表

数据描述性分析.ppt

相关文档

文档介绍

文档介绍:数据描述性分析
内容分布
均值、方差的数据特征
数据的分布
二元数据的数字特征及相关系数
误差
坏值的剔除
数据描述性分析
数据分析研究的对象是数据,它们是个观测值:

如果这个观测值就是所要研究对象的全体,那么数据分析的任务就是提取数据中包含的有用的信息。如果数据是从总体中抽出的样本,就要分析推断样本中包含的总体的信息。
,
均值、方差等数字特征
一元数据的数字特征主要是以下几种。设个观测值为
其中称为样本容量。
1 均值:即是的平均数:

均值表示数据的集中位置。
均值、方差等数字特征
2 方差、标准差与变异系数
方差是描述数据取值分散性的一个度量,
其量纲是数据量纲的平方。
标准差
均值、方差等数字特征
变异系数:刻画数据相对分散性的度量
CV=
校正平方和
CSS=
未校平方和
USS =
均值、方差等数字特征
3 偏度与峰度
偏度与峰度是刻画数据的偏态、尾重程度的度量。它们与数据的矩有关。数据的矩分为原点矩与中心矩。

k阶原点矩

K阶中心矩
均值、方差等数字特征
偏度
其中s是标准差。偏度是刻画数据对称性的指标。关于均值对成的数据其偏度为0,右侧更分散的数据偏度为正,左侧更分散的数据偏度为负。






偏向左
< 0
对称
= 0
偏向右
> 0
均值、方差等数字特征
峰度
当数据的总体分布为正态分布时,峰度近似为0;当分布较正态分布的尾部更为分散时,峰度为正,否则峰度为负。
当峰度为正时,两侧极端数据较多;当峰度为负时,两侧极端数据较少。