文档介绍:第3编概率论与数理统计
第8章数据处理
一、引入:平均数“骗人”
2000年,,平均每平方公里不到100人,可是新加坡超过6000人,蒙古则不到2人.
2000年,我均每户18467元,,%,实际上超过80%的储蓄集中在不到20%的人手里.
2000年,我均利润额都是上升的,可是,除了一两个盈利大户外,其他上市公司的利润额都是下降的,甚至是亏损的.
据此,有人认为,“平均数最能骗人!”
但实际上,平均数又最能服人:
2000年,我国国内生产总值89404亿元,早已进入世界前10名,可是,人均只有7078元,排在100名开外.
2000年,,居世界第一,可是,人均产量不到100公斤,只是我们邻居韩、日两国的1/8左右.
可见,根据经济分析的不同目的,:说明一国经济实力,用年国内生产总值总量为宜;说明一国发展阶段,用人均国内生产总值为宜;说明一国发展速度,用国内生产总值增长率为宜;说明一国经济效益,用人均劳动生产率为宜;说明一国收入分配,以基尼系数为宜.
为此,要全面描述一个总体的各种特点,,,使用方法却分优劣.
二、本章内容结构
三、学习方法
这一章的中心内容是对搜集到的数据进行适当处理,,介绍了三种基本的数据处理方法:
,如均值、方差等等;
;
、频率直方图及频率密度曲线等.
同时,为了对统计知识有初步的了解,还介绍了几个常见的概念:;.
,从理解总体和样本的概念入手,要理解研究总体是从研究样本数据开始的,研究样本数据的目的是为了推断总体的性质. 弄清了这一点,很自然地会想到面对收集到的一批样本数据如何进行处理的问题. 如果收集到的数据少,通过计算它的均值或加权平均数、几何平均数、方差或标准差等特征数,从而对总体有一个大致的了解,有时甚至可用更简单、方便的方法,如通过中位数、众数或极差等特征数,粗略地了解总体的情况. 但如果想更多地知道总体性质;如数据在哪个范围内出现的次数最多?某个范围内数据出现的百分比是多少?等等,就需要抽取更多的样本数据进行研究
.这时仅计算数据的特征数是不够的,需要通过对数据进行适当的分组,计算组频数、组频率等指标,,计算均值和方差也是比较麻烦的,寻找一种简便的均值和方差的计算方法,,它包含组限、组中值、,就是绘制频数直方图和频率直方图,从中可以直观地看出数据的统计规律性. 由于我们获得的资料往往是客观对象中的一部分(也就是样本),设想如果能够将全部的资料都收集到,则它的频率直方图就可以用一条连续的曲线来代替,这条曲线描述的就是总体的分布