1 / 45
文档名称:

描述性统计分析.ppt

格式:ppt   大小:757KB   页数:45页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

描述性统计分析.ppt

上传人:2112770869 2018/4/29 文件大小:757 KB

下载得到文件列表

描述性统计分析.ppt

文档介绍

文档介绍:描述性统计分析
统计分析的基本概念
武汉大学计算中心
LOGO
进行数据分析首先应:
明确分析的目的
明确分析的对象
确定是否需要抽样
在一些问题中,要考查整个总体往往是不可能的,因为要耗费太多的时间和资源
确定需要记录的数据项目
武汉大学计算中心
LOGO
1. 总体和样本
总体(population)是所研究的指标测量值的集合。
总体
样本
抽样(sampling)是指从总体中抽取部分的做法。
样本(sample)通过抽样得到的总体的一个子集。
武汉大学计算中心
LOGO
抽样方法
简单随机抽样:在抽样的过程中,任何一个样本被选中的机会都相同。
利用计算机产生的随机数(对于有限总体),可模拟简单随机抽样,如对学生的学号用随机数进行抽样
对于无限总体不能进行标号,抽样过程不能用随机数,难于实施
分层抽样:按数据的层次进行抽样。
如小学生的身高,按每年级分为一个层
武汉大学计算中心
LOGO
分层抽样的优点
抽取的样本在总体中分布得更均匀,更合理
个层内单位之间差异程度相对减小,使在该层内抽取的样本对该层的代表性得到提高
层内成员差异小,而层间成员差异较大时,分层抽样可以提高估计的精度
武汉大学计算中心
LOGO
2. 参数和统计量
对总体概括度量值和对样本概括度量值所用的方法及名称是不同的。
总体的度量值称为参数(parameters),样本的度量值称为统计量(statistics)。
通常,总体参数是未知的,SAS系统给出的描述统计量适用于样本。
武汉大学计算中心
LOGO
2. 参数和统计量
参数(parameters):总体的度量值。
统计量(statistics):样本的度量值。
一般总体参数用希腊字母表示:
均值方差标准差
总体μσ2 σ
样本 X s2 s
武汉大学计算中心
LOGO
3. 自由度
自由度是某一统计量中,变量可以自由取值的个数
用df表示自由度。
[例]变量X有n个取值, df=n;若它们受到k(k<n)个条件制约,则df=n-k
武汉大学计算中心
LOGO
4. 表示数据位置的统计量
均值(Mean):
所有观测值的平均值。
中位数(Median或Med):用以描述数据取值的中心位置。
中位数的计算方法:先将数据从小到大排序,x1,x2,…,xn然后计算:
中位数的优点是它不受个别极端数据的影响,具有稳健性
武汉大学计算中心
LOGO