文档介绍:第四章 统计分类器
.
概率论基本知识
确定事件:概念是确定的,发生也是确定的;
随机事件:概念是确定的,发生是不确定的;
模糊事件:概念本身就不确定。
.
随机变量
随机变量:随机事件的数量表示;
离散随机变量:取值为离散的随机变量 ;
连续随机变量:取值为连续的随机变量 ;
.
频率和概率
频率:试验在相同的条件下重复N次,其中M次事件A发生,则A发生的频率为:fN(A) = M / N;
概率:当N很大时,频率会趋向一个稳定值,称为A的概率:
.
联合概率和条件概率
联合概率:设A,B是两个随机事件,A和B同时发生的概率称为联合概率,记为:P(A, B);
条件概率:在B事件发生的条件下,A事件发生的概率称为条件概率,记为:P(A|B);
乘法定理:P(A|B) = P(A, B) / P(B)。
.
概率密度函数
概率分布函数:设X为连续型随机变量,定义分布函数;F(x) = P(X≤x);
概率密度函数:如果存在一个非负函数p(x)使得下式成立,则p(x)称为的概率密度函数:
.
全概公式
互不相容事件:如果试验时,若干个随机事件中任何两个事件都不可能同时发生,则称它们是互不相容的。
全概公式:若事件只能与两两不相容的事件A1, A2,…, AN之一同时发生,则有:
.
贝叶斯公式
离散形式:A, B为离散随机变量:
连续形式:A为离散随机变量,B为连续随机变量:
.
概率分类器的问题提出
已知:M个类别的先验概率P(Ωi),类条件概率P(X| Ωi);
对类别未知样本X进行分类。
.
最小错误率准则
寻找一个类别i,使得Pi(e)最小;
等价于后验概率P(Ωi|X)最大。
将X分类为Ωi类所产生的误判概率为:
.