文档介绍:下载
第 2 章
■统计基础知识复习
即使从最应用性的角度,经济计量学的学习也要求对统计学有较好的了解。我们假设大多
数读者学过统计学,但我们知道这些知识需要更新。在继续学习计量经济学之前,我们将复习
统计学的观点,这些知识将在以后的各阶段中发挥它们的作用。为帮助读者把注意力放在重要
的观点而不是细节上,我们把大部分推导放在附录 2 - 1中。
随机变量
随机变量是变量,它可以取不同的值,并且取每一个值的概率小于等于 1。我们可以通过
研究随机变量生成各个取值的过程来描述一个随机变量,这个过程称做概率分布。概率分布列
出所有可能出现的结果及每个结果发生的概率。我们可以将随机变量定义为一个函数,这个函
数为每一个试验结果赋予一个实数值。例如,假设抛硬币出现正面的取值为 1,反面的取值为
0 (如果硬币是均匀的,出现正面的概率将为 1 / 2 )。此例中我们可以把抛硬币的取值看作一个随
机变量;生成这个随机变量的过程是二项概率分布。
弄清离散型随机变量和连续型随机变量之间的区别是很有用的。一个连续型随机变量可以
取实数轴上的任何值,而一个离散型随机变量只能取若干特定的实数值。图 2 - 1表示的是离散
型随机变量和连续型随机变量的概率函数。由图 2 - 1中离散型随机变量的分布,我们看到取值
1 0和2 0发生的概率都是0 . 2 5,而取值 4 0发生的概率为0 . 5 0。在图2 - 1的连续型分布中,随机变量
的取值位于某两个值之间的概率是由这两个值之间连续密度函数之下的面积决定的。在此例中,
随机变量取值位于1 0和2 0之间的概率约等于0 . 3,即图中的阴影部分。
a) 离散型 b) 连续型
图2-1 概率密度
下载第2章统计基础知识复习 13
期望值
人们经常用均值和方差来描述概率分布,它们都是由期望算子 E定义的。因为我们将从离
散型随机变量开始讨论,因此设 X1、X2⋯ XN代表随机变量X的N个可能结果,则 X的均值或期望
值是所有可能结果的一个加权平均值,其中权重为各结果发生的概率。具体说来, X的均值(记
为µX)定义为:
(2-1)
其中pi为Xi发生的概率, å pi= 1,且E( )为期望算子。
期望值应与样本均值区分开来,后者表示样本的平均值,而样本是一组对某一概率分布进
—
行观测得到的观测值(观测值的选取一般是随机的)。X的一组观测值的平均值记为 X 。
2
随机变量的方差是随机变量在其均值周围分散或离散程度的一个度量,记为 s X。(在离散
型随机变量情况下),方差的定义为
(2-2)
因此方差是 X的取值与其期望值之差平方的加权平均,其中权重为相应取值发生的概率。式
( 2 - 2 )中的方差本身也是一个期望,这是因为
(2-3)
方差的(正)平方根称为标准差。
期望算子有很多有用的性质,特别在讨论随机变量的期望和方差时更为有用。我们建议读
者仔细阅读附录2 - 1中的细节。以下是有关期望算子的三个主要的结论:
结论1 其中X是随机变量,a、b是常数
结论2
结论3
随机变量的联合分布
研究X和另一个随机变量 Y之间的联合分布是很有用处的。在离散情形下,联合分布可以
用一个概率分布表描述,这个分布表列出 X和Y所有可能结果出现的概率。例如,如果 Y是这样
的一个随机变量,即当户主受过大学教育时,取值为 1;否则取值为 0;而X是前面描述过的家
庭收入变量,那么X和Y的联合分布如下:
结果概率结果概率
X=$5000, Y= 1 0 X=$10 000, Y= 0 1 / 8
X=$5000, Y= 0 1 / 4 X=$15 000, Y= 1 1 / 3
X=$10 000, Y= 1 1 / 8 X=$15 000, Y= 0 1 / 6
注意:所有概率都是非负的,而且它们的和为 1。
与单个随机变量的情况一样,期望算子对于描述联合分布的重要性质也是很有用的。我们
将X和Y的协方差定义为X、Y与各自均值离差乘积的期望;
(2-4)
14 第1部分回归分析基础下载
其中pi j表示X与Y发生的联合概率。
协方差是X与Y之间线性相关关系的一个度量。如果两个变量总是同时大于或小于各自的
均值,则协方差为正,如图 2 - 2 b所示。如果Y小于其均值时 X大于其均值,或者 Y大于其均值时
X小于其均值,则协方差为负,如图 2 - 2 a所示。协方差的值依赖于 X和Y的度量单位。因此我们
经常用到相关系数
(2-5)