1 / 18
文档名称:

数据挖掘_贝叶斯定理(第三章) (1).ppt

格式:ppt   页数:18
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘_贝叶斯定理(第三章) (1).ppt

上传人:zbfc1172 2013/1/8 文件大小:0 KB

下载得到文件列表

数据挖掘_贝叶斯定理(第三章) (1).ppt

文档介绍

文档介绍:贝叶斯分类
不难想象,数据并不是总体或系统建模是唯一可利用的信息资源。
贝叶斯方法提供了一套将外部客观信息融入数据分析过程中的原理方法。这个分析过程是先给出一个待分析数据集的概率分布。因为这个分布是没有考虑任何数据而给出的,所以称为先验分布。这个新的数据集将先验分布修正后得到后验分布。贝叶斯定理就是在知道新的信息后修正数据集概率分布的基本工具。
贝叶斯定理为解决归纳-推理分类问题的统计方法提供了理论背景。我们首先介绍贝叶斯定理中的基本概念,然后在运用这个定理说明朴素贝叶斯分类过程和简单贝叶斯分类。
设X是一个未知类标号的数据样本,设H为某种假定: 数据样本X属于某特定的类C。我们希望确定,即给定观测数据样本X后假定H成立的概率。它是表示给出数据集X后我们对假定的信任度的后验概率。相反,不管数据样本看上去如何,对于任何样本来说都是先验概率。后验概率
比先验概率基于更多的信息。
数据样本是数据挖掘过程的基本组成部分
贝叶斯定理提供了一种由概率、
和来计算后验概率的方法,其基本关系是:
现在假定有一组m个元素的样本S={ }(训练数据集),其中每一个样本代表了一个n维向量{ }。值分别和样本属性相对应。并且有k个样本类,
每一个样本属于其中一个类。另外给出一个数据样本X(它的类是未知的),可以用最高的条件概率来预测X的类,这里i=1,…,k。这是朴素贝叶斯分类的基本思想。
可以通过贝叶斯定理计算这些概率:
因为对所有的类别都是个常量,仅要求乘积的最大值。我们用下面的式子计算一个类别的先验概率。
= 类别的训练样本数量/m(m是训练样本的总数).
因为的计算是极其复杂的,特别是对大量的数据集来说,所以要给出零假设:样本各属性之间条件独立。利用这个假设,我们用一个乘积来表示.
= 其中是样本X的属性值,
能够通过训练数据集来计算.

最近更新

2024年杭州科技职业技术学院单招职业倾向性考.. 41页

2024年林州建筑职业技术学院单招职业倾向性测.. 42页

2024年株洲师范高等专科学校单招职业倾向性测.. 40页

2024年桂林师范高等专科学校单招职业倾向性测.. 39页

2024年武汉海事职业学院单招职业技能考试题库.. 39页

2024年毕节医学高等专科学校单招职业适应性测.. 41页

2024年汉中职业技术学院单招职业倾向性考试模.. 39页

2024年汝州职业技术学院单招职业倾向性测试题.. 40页

2024年江海职业技术学院单招综合素质考试模拟.. 40页

2024年江苏省南京市单招职业适应性考试模拟测.. 40页

2024年江苏省扬州市单招职业适应性考试题库及.. 40页

2024年江苏省苏州市单招职业适应性考试题库及.. 40页

2024年江苏航空职业技术学院单招职业适应性测.. 41页

2024年江西冶金职业技术学院单招职业技能考试.. 40页

2024年江西工业职业技术学院单招职业技能考试.. 40页

2024年江西工程学院单招职业技能测试模拟测试.. 41页

2024年江西应用科技学院单招职业倾向性考试题.. 39页

2024年江西旅游商贸职业学院单招职业倾向性考.. 40页

2024年江西水利职业学院单招职业倾向性测试模.. 40页

2024年江西洪州职业学院单招职业适应性考试题.. 40页

2024年江西电力职业技术学院单招综合素质考试.. 39页

2024年江西省吉安市单招职业倾向性考试模拟测.. 40页

2024年江西科技职业学院单招职业倾向性测试题.. 40页

2024年江西青年职业学院单招职业倾向性考试模.. 39页

ZR-003 建设单位法人授权书 1页

2023年四川省凉山州数学中考真题试卷【含答案.. 32页

铁路钢轨探伤车运用管理办法 21页

青岛市电梯安全运行服务规范 20页

急性特发性生理盲点扩大综合征一例 8页

川机管函〔2016〕313号 2页