文档介绍:统计学
第四章数据的描述2——重要的统计量
第四章数据的描述2---重要的统计量
§1 集中趋势的描述
§2 离散趋势的描述
§3 偏态与峰度的描述
§4 数据的标准化处理
§1 集中趋势的描述
集中趋势
是指一组数据向某中心值靠拢的倾向,是描述数据分布的一个重要特征。
集中趋势的测度
实际是对一组数据的一般水平代表值或中心值的测度。
§1 集中趋势的描述
§ 均值
§ 中位数
§ 众数
§ 均值、中位数、众数之间的比较
§
均值(Mean)
又称平均数,是一组数据大小相互抵消的结果,可以看作是数据集的重心。
是最主要的集中趋势测度统计量。
适用于定量变量的取值,一般用符号表示。
§
未经分组整理的原始数据,其算术平均(arithmetic mean)的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。
设一组样本数据为、、、,则算术平均数的计算公式为:
§
根据分组整理的数据计算的算术平均数,要以各组变量值出现的次数或频数为权数计算加权算术平均数。
假设样本数据被分成组,样本数据各组变量的代表值用m1、m2、…、mk 表示,各组变量值出现的频数用f1、f2、…、fk ,则加权算术平均数的计算公式为:
§
如果是单变量分组,上式中的代表值就是各组的分组变量值;
如果是组距分组,上式中的代表值就是各组的组中值。
加权算术平均数其数值的大小,不仅受各组变量值大小的影响,而且受各组变量值出现的频数即权数大小的影响。
§
算术平均数的数学性质:
性质1 各变量值与其算术平均数的离差之和等于零,即:
性质2 各变量值与其算术平均数的离差平方和最小,即:
或
最小值或
最小值
§
【】根据表中给出的某项调查中30名被访者的月收入水平分组数据,计算其平均收入水平: