1 / 68
文档名称:

贝叶斯算法PPT.ppt

格式:ppt   大小:2,003KB   页数:68页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

贝叶斯算法PPT.ppt

上传人:yuzonghong1 2017/11/14 文件大小:1.96 MB

下载得到文件列表

贝叶斯算法PPT.ppt

文档介绍

文档介绍:数据挖掘分类之
主讲人:软件学院卢卫刚
贝叶斯网络
目录
贝叶斯网络
2
贝叶斯分类
1
总结
4
贝叶斯网络的应用及实例
3
致谢
5




背景
近几十年来,互联网的普及使得人们获得和存储数据的能力得到逐步的提高,数据规模不断壮大。面对“数据丰富而知识匮乏”的挑战,数据挖掘技术应运而生。数据挖掘是一门多学科的交叉领域,涉及统计学,机器学****神经网络、模式识别、知识库系统、信息检索、高性能计算和可视化等学科。而数据挖掘中的分类技术是一项非常重要的技术。
Q1 什么是分类
超市中的物品分类
生活中的垃圾分类
Q1 什么是分类
分类就是把一些新的数据项映射到给定类别的中的某一个类别,比如说当我们发表一篇文章的时候,就可以自动的把这篇文章划分到某一个文章类别。
分类也称为有监督学****supervised learning),与之相对于的是无监督学****unsupervised learning),比如聚类。
分类与聚类的最大区别在于,分类数据中的一部分的类别是已知的,而聚类数据的类别未知。
分类在数据挖掘中的学术定义
Q2 分类问题
名称
胎生
会飞
水中生活
有腿
类别
Human




哺乳动物
python




非哺乳动物
salmon




非哺乳动物
whale




哺乳动物
frog


有时

非哺乳动物
komodo




非哺乳动物
bat




哺乳动物
pigeon




非哺乳动物
cat




哺乳动物
leopard_shark




非哺乳动物
turtle


有时

非哺乳动物
penguin


有时

非哺乳动物
porcupine




哺乳动物
eel




非哺乳动物
salamander


有时

非哺乳动物
gila_monster




非哺乳动物
platypus




哺乳动物
owl




非哺乳动物
dolphin




哺乳动物
eagle




非哺乳动物
胎生
会飞
水中生活
有腿
类别




?
Q2 分类问题
税号
去年退税
婚姻状况
可征税收入
逃税
1

单身
125k

2

婚姻中
100k

3

单身
70k

4

婚姻中
120k

5

离婚
95k

6

婚姻中
60k

7

离婚
220k

8

单身
85k

9

婚姻中
75k

10

单身
90k

Q2 分类的流程
动物种类
体型
翅膀数量
脚的只数
是否产蛋
是否有毛
类别


0
4


爬行动物


0
4


爬行动物


0
4


爬行动物
麻雀

2
2


鸟类
天鹅

2
2


鸟类
大雁

2
2


鸟类
动物A

0
2


?
动物B

2
2


?
根据现有的知识,我们得到了一些关于爬行动物和鸟类的信息,我们能否对新发现的物种,比如动物A,动物B进行分类?