文档介绍:第4 章数理统计的基础知识
从第4章开始,将研究数理统计的基本内容。
数理统计与概率论的基本概念与方法有着密切的联系。概率论是数理统计的理论基础和工具,而数理统计则是概率论的应用。
数理统计也是研究随机现象的学科。当我们用一个随机变量去描述一种随机现象时,通常我们对这个随机变量所服从的分布类型可能一无所知,或者根据该随机现象的某些特征、以及人们的经验而知道随机变量分布的类型,但不知道其分布中所含参数的值。
例如,某灯泡厂每年生产上万只灯泡,这些灯泡中的每一个都具有这样的特征:“不是合格品,就是次品”。因此,随机检查一个灯泡时,它或者是合格品,或者是次品。这是一个随机现象。
当用随机变量 X 去描述这个随机现象时,
记 X ——任取一件产品中的次品数,
则,随机变量 X 服从参数为 p 的
0 — 1 分布 b( 1 , p ) ,其概率分布列为,其中 p 是
次品率,是随机变量 X 的分布中所含的未知参数。
要想了解当天所生产的灯泡的质量(即次品率),一个可行的方法就是,抽取一定量的灯泡(如 20 个)进行质量检查,并根据这一部分灯泡的质量情况对整批灯泡的质量进行估计或做出某种判断。
数理统计学就是以概率论为理论基础,研究如何获取有用的观察资料,如何根据所得到的有限资料对整个随机现象所具有的统计规律性进行科学的分析,从而做出尽可能准确可靠的推断这类问题的数学分支。
数理统计的中心任务是:从局部的观测资料的统计特性出发,利用科学的方法,来推断事物整体的统计特性。
数理统计学通常由两个主要部分组成。
一个是抽样理论和实验设计,研究如何更合理地获取观察资料,如何进行抽样、抽多少等问题。
由于数理统计学所涉及研究的对象一般为数很大,而限于时间和经济上的考虑,人们只可能收集一部分数据。
例如,在收集某批电器产品的使用寿命的实验数据时,往往需要对产品进行破坏性的检验,因此只能检验其中的一小部分产品,观察其使用寿命,并依此推断整批产品的使用寿命。
这就要求人们研究有效地收集数据的方式,精心设计收集数据的方法,以保证所收集到的一小部分数据能够尽可能多地提供与所研究的整个问题有关的真实的信息。
另一个是统计推断,研究如何对所获取的有限的资料进行科学地分析,用科学的方法提取和分析寓于所收集到的有限数据中的信息,并运用统计推断的方法,在更大的范围内对所研究的问题做出尽可能准确、可靠的推断,得出某种合理的结论。
统计推断是数理统计学的基本问题之一,在此主要介绍统计推断的一些基本知识。
在统计学的研究过程中,人们关心的并不是所研究对象(总体)的所有特征,而仅仅是关心反映所研究对象某一特征的某一项或某几项数量指标。
例如,反映学生“概率统计”课程的学****情况的数量指标,就是学生这门课程的考核成绩(并不需要考虑学生的身高、体重等指标) 。
对于所选定的数量指标 X (可以是向量)而言,由于每个个体的取值是不同的,且每个个体的取值在测试结束之前是不能确定的,因此数量指标 X 是一个随机变量(或随机向量)。
为了研究方便,通常把总体(具有一定共同属性的研究对象的全体)与数量指标 X 等同起来,并把数量指标 X 的分布称为总体的分布。即
定义 () 统计学中,称随机变量(或随机向量)X 为总体,并把随机变量(或随机向量)X 的分布称为总体分布。
注():①总体 X 的分布一般是未知的。有时虽然已知总体分布的类型(如正态分布、伯努利分布等),但这些分布中所含的参数(如、 2 ,p 等)也是未知的。统计学的主要任务,就是对总体的未知的分布或参数进行推断。
②对于所研究对象的定性指标,也可以转化为定量指标(即数量指标)来研究,进而可以设定一个随机变量来表示所研究的总体。
例如,“考察学生的学****成绩是优秀、合格还是不合格”时,仍然可以用一个随机变量 X 来描述:
令。