文档介绍:贝叶斯分类的讲解和使用
一、贝叶斯公式的使用
这就是贝叶斯公式,本质我们只要知道了,问题实际上是很简单的。
贝叶斯公式是利用先验经历对未来的事情进行预测,说白了就是根据以往的经验对未来的事情进行预测。感觉好像很厉害的样子。我们具体贝叶斯分类的讲解和使用
一、贝叶斯公式的使用
这就是贝叶斯公式,本质我们只要知道了,问题实际上是很简单的。
贝叶斯公式是利用先验经历对未来的事情进行预测,说白了就是根据以往的经验对未来的事情进行预测。感觉好像很厉害的样子。我们具体找个例子来看看就可以了。
这个例子实际上用处很广泛,只要是分类算法,一般都使用这个例子来说明。
我现在的由上面这些样例,我们成为历史经验,我们要预测的是
<sunny,cool,high,TRUE>
我们需要判断这个例子是属于Yes还是No,问题很简单。OK,现在先把问题明确了,至于如何求解我们下面再说。
二、使用贝叶斯分类具体过程
如何判断这个记录属于哪一类,可以把问题转化成这个例子和哪一类的概率最大。这样就把问题转化为这个例子属于Class1的概率是多大?那就那问题转化了,这个想法本质上和KNN分类的转化思想是一致的,KNN使用的是距离,当然不仅仅局限于欧式距离还可以是余弦相似度,我们找一个最小的值就行了。
这里X表示特征。
在使用贝叶斯公式,我们就可以得到一个更好的公式,
就是第二个式子加了一个反向的贝叶斯公式。
下面我们来做一个假设:所有的特征都是独立的。
在这条假设的基础上,我们得到下面的这一条公式:
我们把东西拆开看看:
:表示这个属性出现的概率,这个是比