1 / 70
文档名称:

数据描述性分析.ppt

格式:ppt   大小:830KB   页数:70页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据描述性分析.ppt

上传人:文库新人 2018/9/11 文件大小:830 KB

下载得到文件列表

数据描述性分析.ppt

文档介绍

文档介绍:内容分布
均值、方差的数据特征
数据的分布
二元数据的数字特征及相关系数
误差
坏值的剔除
数据描述性分析
数据分析研究的对象是数据,它们是个观测值:

如果这个观测值就是所要研究对象的全体,那么数据分析的任务就是提取数据中包含的有用的信息。如果数据是从总体中抽出的样本,就要分析推断样本中包含的总体的信息。
,
均值、方差等数字特征
一元数据的数字特征主要是以下几种。设个观测值为
其中称为样本容量。
1 均值:即是的平均数:

均值表示数据的集中位置。
均值、方差等数字特征
2 方差、标准差与变异系数
方差是描述数据取值分散性的一个度量,
其量纲是数据量纲的平方。
标准差
均值、方差等数字特征
变异系数:刻画数据相对分散性的度量
CV=
校正平方和
CSS=
未校平方和
USS =
均值、方差等数字特征
3 偏度与峰度
偏度与峰度是刻画数据的偏态、尾重程度的度量。它们与数据的矩有关。数据的矩分为原点矩与中心矩。

k阶原点矩

K阶中心矩
均值、方差等数字特征
偏度
其中s是标准差。偏度是刻画数据对称性的指标。关于均值对成的数据其偏度为0,右侧更分散的数据偏度为正,左侧更分散的数据偏度为负。






偏向左
< 0
对称
= 0
偏向右
> 0
均值、方差等数字特征
峰度
当数据的总体分布为正态分布时,峰度近似为0;当分布较正态分布的尾部更为分散时,峰度为正,否则峰度为负。
当峰度为正时,两侧极端数据较多;当峰度为负时,两侧极端数据较少。
总体的数据特征
设观测数据是由总体X中取出的样本,总体的分布函数是F 。当X为离散分布时,总体的分布可由概率分布列刻画:
总体为连续分布时,总体的分布可由概率密度刻画。连续分布中最重要的是正态分布,它的概率密度及分布函数分别为
具有正态分布的总体成为正态总体