文档介绍:第五章数理统计的基本概念
§ 总体样本统计量
§ 抽样分布
§ 数据简单处理技术(自学)
数理统计
数理统计
一、数理统计及其任务
数理统计是一门以概率论为基础的应用学科。它是研究如何有效地收集、整理、分析带有随机性的数据,以便对所考察的问题作出推断和预测,从而为决策提供依据。
数据的随机性来源有二:一是由于种种原因(如所涉及的研究对象数量很大),人们不可能对其全部进行研究,而只能以一定方式挑选其中一部分考察,这一部分的挑选就必然带有随机性;二是试验的随机误差,这是指试验中无法控制或未加控制,甚至不了解的因素引起的误差。
数理统计的任务就是研究有效地收集数据,科学地整理与分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论。
有效地收集数据有两方面的含义:一是可以建立一个数学上可处理并尽可能简单方便的模型来描述所得到的数据;二是要收集包含尽可能多的与所研究的问题有关的信息。
数理统计研究问题的方式,不是对所研究对象的全体( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。
数理统计方法具有“部分推断整体”的特征。
二、数理统计研究问题的一般流程
分析问题
确定总体
收集数据
试验设计
抽样
数据整理
统计推断
参数估计
假设检验
我们这门课所学的数理
统计实际上是统计推断
及其应用(方差分析与
回归分析)的一部分内
容。
为什么要用数理统计方法研究问题?随机现象有它的规律性,随机现象的特点注定了进行足够多次观察,其规律性才能清楚地呈现出来。但是,客观上只允许对随机现象进行有限次观察试验,只能获得局部观察资料.
三、概率论与数理统计的区别与联系
1、概率论与数理统计的联系
2、概率论与数理统计的区别
主要体现在研究方法的差别上:概率论是在已知随机变量服从某种分布(概率函数、概率密度、分布函数)的情况下,研究随机变量分布的性质,数字特征和它的应用。例如:已知随机变量的概率密度求它的分布函数、数学期望、方差;已知随机变量的分布求其函数的分布等,而数理统计则是通过对样本数据的统计分析,从中得到能够描述研究对象的某个随机变量的具体分布和数字特征,以此推断对象整体所具有的规律。前者用的是演绎法,后者用的是归纳法。
都以随机现象为对象,研究其统计规律性。
一、总体与总体特征数
(Population)
Def 在数理统计中,把研究对象的全体称为总体,而把组成总体的每个单元称为个体。描述总体单元在某方面特性的名称或记号称为总体指标;总体指标分为数量指标与属性指标。个体数量指标的观察值称为指标值。
总体中所包含的个体的个数称为总体的容量。
…
研究某批灯泡的质量
…
总体
个体
§ 总体样本统计量
数理统计以探究随机现象的数量化规律为目标,所以对总体的研究转化为对其某项或某几项数量指标的研究。这时,把所研究的全部对象的某项(数量)指标构成的集合称为总体。把构成总体的每个元素的数量指标称为个体。
总体
指标值全集
指标
随机变量
一般的,把总体与某个随机变量的可能取值的集合等同,把总体分布与某个随机变量的分布等同,把对总体的研究转化为对某个随机变量规律的研究。
数理统计中提到的总体,是指分布未知或者分布类型已知但至少某些参数未知的随机变量,常用X,Y,Z等表示。
例如:研究某批灯泡的质量时,关心的指标是寿命,由于任何一个灯泡,其寿命在使用前无法预知,是一个随机变量那么,因此,该总体就可以用随机变量X和其概率分布表示。
2. 总体特征数
常用的总体特征数如下:
二、样本
总体作为随机变量,其分布一般是未知的,或者它的某些参数是未知的,如何判断总体服从某种分布或估计未知参数,一般做法是从总体中抽取一些个体进行观察,从中得到研究总体所需要的数量指标,然后通过对这些数据的统计分析,从而对总体的分布作出判断或对未知参数作出估计。
(Sample)
(1) Def 按一定规则从总体中抽取一部分总体单元进行观测或试验,这一抽取过程称为“抽样”,所抽取的部分总体单元的整体称为总体的一个样本(子样)。样本中所包含的总体单元称为样本单元,样本中样本单元的数目称为样本容量。
样本
样本实现
抽定
(2) 简单随机样本(Independence identical distribution)
Def
例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中再抽第二件产品,则这样获得一个简单随机抽样。
实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。