文档介绍:商务统计学教学课件
三、统计学的基本概念
(一)总体和个体
组成统计活动研究对象的全部事物的全体集合,就称为统计总体,简称总体或母体;而总体中的各个事物则称为个体,总体中个体的数量称为总体容量。
1、自然物体总体与人布模型
一、次数分布的概念
(一)次数分布:观测变量的各个不同取值及其出现次数的顺序排列,称为变量的次数分布。
(二)总体次数分布和样本次数分布
(三)次数分布的作用——观测变量的次数分布包含了观测变量取值的全部信息。根据观测变量的次数分布,可以对观测变量的各种分布特征进行描述和分析。
二、次数分布表及其编制
(一)次数分布表的种类
1、单值分组次数分布表
2、组距分组次数分布表
(二)组距分组次数分布表的编制方法
1、确定组数
等距分组的斯特吉斯公式:m=1+
2、确定组距
等距分组的参考组距:
3、确定组限
4、计数各组的次数
5、列出次数分布表
三、次数分布图
用线和面等形状来显示观测变量次数分布状况的几何图形,称为次数分布图。
常用的次数分布图主要有柱状图、直方图和折线图等几种。
四、 次数分布的理论模型
(一)理论分布模型的概念与意义
随机变量取某个数值或在某个区间取值是一个随机事件,使用概率理论计算的随机变量在各个数值上或在各个区间内取值的概率分布,就是随机变量的理论分布,计算此理论分布的概率理论模型就是其理论分布模型。
在现实生活中,各种观测变量的概率分布都可以用某个理论概论分布模型去近似描述。因此就可据此理论分布模型进行分析推断。
四、次数分布的理论模型
(二)理论分布模型的表示方法
1、概率分布表
2、概率分布图
3、概率分布函数式
五、离散变量概率分布模型
记所考察的离散变量为x,假设该随机变量共可取m个不同的值,它取值为xi的概率为pi,并记随机事件x=xi的概率为P(x=xi),则离散随机变量的概率分布可表示为:
P(x=xi)=pi ; i=1,2…,m.
在统计分析推断中,常用的离散变量概率分布模型主要有两点分布、二项分布、超几何分布和泊松分布等几种。
(一)两点分布
假设总体中有两类共N个个体,其中取值为“是”的有N1个,取值为“非”的有N0个,则有:
(二)二项分布
假设在0-1分布总体中,取“是”值的个体比例为p,取“非”值的比例为q,现从中有放回地随机抽取n个个体,记X为取“是”值的个体数目,则其中恰有n1个个体取“是”值、且有n0=n-n1个个体取“非”值的概率为:
(三)超几何分布
假设0-1总体中共有N个个体,其中取“是”值的个体有N1个,取“非”值的个体有N0个。现从不放回地随机抽取n个个体,记x为取“是”值的个体数目,则其中恰有n1个个体取“是”值、且有n0=n-n1个个体取“非”值的概率为:
(四)泊松分布
泊松分布是稀有事件出现次数的理论分布模型,如自然灾害、意外事故、机器故障等事件出现的次数都近似地服从泊松分布。泊松分布概率模型为:
六、连续变量概率分布模型
连续型随机变量的取值范围可以是数轴上的某个区间,也可以是整个数轴。由于它可以取无穷多个不同的数值,所以描述其概率分布的最完善方法是概率函数式。在理论分析中,描述连续变量概率分布的最常用的概率函数式是概率分布密度函数。
在统计分析推断中,常用的连续随机变量概率分布模型主要有均匀分布、正态分布、χ2分布、t分布和F分布等几种。
(一)均匀分布
若随机变量x在区间[a,b] 上服从均匀分布,则该随机变量的概率密度函数为:
(二)正态分布
若随机变量x服从正态分布,则其概率密度函数就为:
(三)χ2分布
若随机变量z1、z2、…、zn都服从标准正态分布N(0,1),且两两之间相互独立,则这些标准正态变量的平方和x就服从χ2分布,其概率密度函数为:
(四)t分布
若随机变量z ~N(0,1),x~χ2(n),且二者相互独立,则:
服从学生氏t分布,概率密度函数为:
(五)F分布
若随机变量xm~χ2(m),xn~χ2(n),旦二者相互独立,则:
服从F分布,其概率密度函数为:
第四章 分布特征测度
一、分布