文档介绍:概率论与数理统计
第六讲
主讲教师:李学京
北京工业大学应用数理学院
连续型随机变量 X 所有可能取值充满若干个区间。
§ 连续型随机变量
P{X=a}=?
一台电视机的使用寿命是5年概率有多大?我们关心的是什么问题?
P{X>a}=?
例1:某工厂生产一种零件,由于生产过程中各种随机因素的影响,零件长度不尽相同。现测得该厂生产的100个零件长度(单位: mm)如下:
频率直方图
129, 132, 136, 145, 140, 145, 147, 142, 138, 144, 147, 142, 137, 144, 144,
134, 149, 142, 137, 137, 155, 128, 143, 144, 148, 139, 143, 142, 135, 142,
148, 137, 142, 144, 141, 149, 132, 134, 145, 132, 140, 142, 130, 145, 148,
143, 148, 135, 136, 152, 141, 146, 138, 131, 138, 136, 144, 142, 142, 137,
141, 134, 142, 133, 153, 143, 145, 140, 137, 142, 150, 141, 139, 139, 150,
139, 137, 139, 140, 143, 149, 136, 142, 134, 146, 145, 130, 136, 140, 134,
142, 142, 135, 131, 136, 139, 137, 144, 141, 136.
这100个数据中,最小值是128,最大值是155。
128
155
作频率直方图的步骤
(1). 先确定作图区间[a, b] ;
a = 最小数据-ε/ 2,b = 最大数据+ε/ 2,
ε是数据的精度。
本例中ε= 1, a = , b = 。
(2). 确定数据分组数 m = [×(n−1)2/5 + 1],
组距 d = (b − a) / m,
子区间端点 ti = a + i d, i = 0, 1, · · · , m;
(3). 计算落入各子区间内观测值频数
ni = #{ xj ∈[ti−1, ti), j = 1, 2, · · · , n},
频率 fi = ni / n, i = 1, 2, · · · , m;
子区间
频数
频率
(, )
6
(, )
12
(, )
24
(, )
28
(, )
18
(, )
8
(, )
4
(4). 以小区间[ti-1,ti] 为底,yi=fi / d ( i=1, 2,
…, m) 为高作一系列小矩形,组成了频
率直方图,简称直方图。
由于概率可以由频率近似, 因此这个直方图可近似地刻画零件长度的概率分布情况。
用上述直方图刻画随机变量X的概率分布情况是比较粗糙的。为更加准确地刻画X的概率分布情况,应适当增加观测数据的个数, 同时将数据分得更细一些。当数据越来越多, 分组越来越细时, 直方图的上方外形轮廓就越来越接近于某一条曲线, 这条曲线称为随机变量X的概率密度曲线,可用来准确地刻画X的概率分布情况。
. 2 概率密度函数
定义1:若存在非负可积函数 f(x), 使随机变量X取值于任一区间(a, b] 的概率可表示成
则称 X为连续型随机变量, f(x)为 X 的概率密
度函数,简称概率密度或密度。
这两条性质是判定函数
f(x) 是否为某随机变量
X 的概率密度函数的充
要条件。
密度函数的性质
f(x)与 x 轴所围
面积等于1。
若x是 f(x)的连续点,则
=f(x),
(3). 对 f(x)的进一步理解:
故, X的概率密度函数f(x)在 x 这一点的值, 恰好是X 落在区间[x , x +△x]上的概率与区间长度△x 之比的极限。这里, 如果把概率理解为质量,f (x)相当于物理学中的线密度。