文档介绍:样本与抽样分布
§ 数理统计的基本概念
例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。
(1)若规定寿命低于1000小时的产品为次品。此问题是求P(X£1000)=F(10000),求F()?
(2)从平均寿命、使用时数长短差异来看其质量,即求E()?、D()?。
要解决二个问题
。
。
方法具有“从局部推断总体”的特点。
(母体)和个体
,把组成总体的每一个对象成员(基本单元)称为个体。
说明:
对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。
(2) X对应(等同)。
总体中不同的数量指标的全体,。
X的分布即是总体的分布情况。
例:一批产品是100个灯泡,经测试其寿命是:
1000小时 1100小时 1200小时
20个 30个 50个
X 1000 1100 1200
P 20/100 30/100 50/100
(设X表示灯泡的寿命),
就是总体寿命的分布,反之亦然。
常称总体X,~F(),有时也用F()表示一个总体。
(3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。
有限总体
无限总体
.
:从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。
取得子样的过程叫抽样。
样本的双重含义:
(1)随机性:
用(X,X,……X) n维随机向量表示。
X表示第i个被抽到的个体,是随机变量。(i=1,2,…n)
(2)确定性:
(,,……)表示n个实数,即是每个样品X观测值(i=1,2,…n)。
: 设总体为X,若X,X……X相互独立且与X同分布,则称(X,X…X)为来自总体X的容量为n的简单随机样本(简称样本)。
(1)已知总体X~F(),则样品X~F() i=1,2…n样本(X,X…X)的联合分布为:
F(,…)=P(X,X…X)
=P(X)
=F()
若总体X~f(),样品X~f() i=1,2……n
样本(X,X……X)的联合密度是:
f(,……)=f()
例:总体X~N(,写出该总体样本(X,X…X)的联合密度。
(2)若总体X是离散型随机变量,一般给出分布律:
P(X=k) = pk. k=1,2……
要写出概率函数f()即f()=P(X=k)= =1,2…..,
例: 总体X~p(l)写出该总体样本(X1,X2,…Xn)的联合概率函数
例:总体X~B(1,p), 0<p<1写出其样本
(X,X,……X)的联合概率函数。
四经验分布函数与直方图
(1)定义:设(1, 2,…n)是来自总体X的一组样本值。将它们按由小到大排序为:
1*£2*£…£i*£…£n* 对任意的实数,
定义函数:
Fn* (x)=
则称F()为总体X的经验分布函数。
格列文科定理:
设总体X的分布函数、经验分布函数分别为F()、Fn*(),则有:
P=1
上式表明,当,概率为1的有F均匀地趋于F()。
2总体的概率密度的估计¾直方图
(第一版) [p143 ]
可以用SAS下的interactive data analysis 模块演示。
五统计量与样本的数字特征
1 : 设X1,X2,…,Xn是来自总体X的容量为n的样本,g(1, 2,…, n)是定义在Rn或Rn子集上的普通函数。如果g中不含有任何未知量,则称g(X1,X2,…,Xn)为统计量。
(样本的数字特征)
:设X1,X2,…,Xn是来自总体X的样本,则称
为样本均值为样本方差
为样本k阶原点矩
为样本k阶中心矩
:设总体X不论服从什么分布,只要其二阶矩存在,即E(X)=μ、D(X)=б2都存在,则:
(1) E()=E(X)=μ
(2) D( )=D(X)=
(3) E(S2)=D(X)=б2
重要恒等式:
§ 抽样分布
统计量是样本的函数,它是一个随机变量。统计量的分布称为抽样分布。
一. 三个重要分布
(一)分布
:设X1,X2,…Xn相互