文档介绍:分类号密级
U D C 学校代码
硕士研究生学位论文
贝叶斯网络分类器与应用
学院(部、所): 信息学院
专业: 计算机应用技术
姓名: 余民杰
导师: 王元亮教授、王双成教授
论文起止时间:2010 年 12 月—2012 年 5 月
学位论文原创性声明
声明:本人所呈交的学位论文,是本人在导师的指导下,独立进行
研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外,本
论文不含其他个人或集体已经发表或撰写过的作品成果。对本文的研究
做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意
识到本声明的法律结果由本人承担。
论文作者签名:
日期: 年月日
学位论文版权使用授权书
本人完全了解云南财经大学有关保留、使用学位论文的规定,即:
学校有权保留并向国家有关部门或机构送交论文和论文电子版,允许学
位论文被查阅或借阅;学校可以公布学位论文的全部或部分内容,可以
采用影印、缩印或其它复制手段保存、汇编、发表学位论文;授权学校
将学位论文的全文或部分内容编入、提供有关数据库进行检索。
(保密的学位论文在解密后遵循此规定)。
论文作者签名: 导师签名:
日期: 年月日日期: 年月日
摘要
贝叶斯网络是一种描述随机变量之间依赖关系的图形模式,是概率理论和图
形理论的结合,是不确定性知识表示和推理的有力工具,已在许多领域得到了广
泛的应用。基于贝叶斯网络可以进行联合概率的条件和边缘分解,从而能够有效
降低运算复杂度、解决与联合概率计算有关的一系列问题。用于分类预测的贝叶
斯网络通常称为贝叶斯网络分类器。
朴素贝叶斯分类器是一种基础的贝叶斯网络分类器,以简单、高效和良好的
分类准确性而著称,但这种分类器基于一个很强的条件独立性假设,使得属性之
间的依赖信息无法得到有效的利用,而这部分信息往往也是分类的重要信息。本
文从朴素贝叶斯分类器的扩展、优化和应用等方面,对选择性朴素贝叶斯分类器
(SNB)、树扩展的朴素贝叶斯分类器(TAN)、K 依赖扩展的朴素贝叶斯分类器
(KDB)、贝叶斯网络扩展的朴素贝叶斯分类器(BAN)、完全贝叶斯分类器(CBC)、
贝叶斯网络分类器的参数集成(Boosted-NB)与动态朴素贝叶斯分类器进行了研
究。
本文主要研究内容如下:
(1) 研究了朴素贝叶斯分类器在处理连续和离散属性时的不同方法,介绍了
特征子集选择以及基于高斯和高斯核函数估计属性条件密度的朴素贝叶斯分类
器。
(2) 详细介绍了朴素贝叶斯的依赖扩展分类器的研究发展脉络,对几种典型
的朴素贝叶斯扩展分类器(比如树扩展朴素贝叶斯分类器 TAN、K 依赖朴素贝
叶斯分类器、基于类约束的贝叶斯网络分类器)的特点进行分析,指出了各自具
有的优点和不足。
(3) 给出了朴素贝叶斯分类器在企业财务风险预警、操作风险预警和高校教
师科研能力评估方面的应用。
(4) 将朴素贝叶斯分类器与时间序列相结合得到动态朴素贝叶斯分类器,提
出了动态朴素贝叶斯分类器的特征子集选择方法,验证了此方法的有效性。并给
I
出动态朴素贝叶斯分类器在经济增长和商品进出口影响分析方面的应用。
关键词:贝叶斯网络;朴素贝叶斯分类器;动态朴素贝叶斯分类器;特征子
集选择;分类准确性评价标准
II
Abstract
work is a graphics mode representing random variable dependencies
among variables, a powerful tool for uncertainty knowledge representation and
reasoning, combination of probabilistic and graphical theory, has been widely applied
in many fields. Based on work, we can pose condition and edge of
the joint probability, plexity consequently, and solve a
range of issues related to joint probability calculation. work for
classification prediction is often referred to as a work classifier.
Naive Bayesian classifier is a basis for a work classifier, and