1 / 51
文档名称:

基于粗糙集朴素贝叶斯分类算法地研究.pdf

格式:pdf   页数:51页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于粗糙集朴素贝叶斯分类算法地研究.pdf

上传人:jd234568 2016/6/20 文件大小:0 KB

下载得到文件列表

基于粗糙集朴素贝叶斯分类算法地研究.pdf

相关文档

文档介绍

文档介绍:摘要数据挖掘是信息技术自然演化的结果,是从大量数据中提取或“挖掘"隐藏的、具有潜在意义的知识的复杂过程。其中,对数据进行分类是数据挖掘领域研究的重要课题。贝叶斯分类法是一种具有坚实的数学理论基础以及综合数据先验信息能力的推理方法,其简单形式朴素贝叶斯分类模型由于具有简单而高效等优点得到了广泛的研究与应用。本文对朴素贝叶斯分类算法的分类原理以及优缺点进行了分析,从两个方面对朴素贝叶斯分类模型进行了深入地研究。首先着重研究通过属性选择来减少该模型的条件独立性假设的局限性,然后在此基础上结合集成学****技术来改进该模型。本文主要研究工作如下: ,提出了一种改进的基于条件熵的属性约简算法ASBCE。该算法引入关联规则中的余弦度量来识别不一致实例,并且根据某个属性是强相关则在一定程度上该属性与其他属性之间也存在较强的相关性的思想来删除冗余属性。实验证明,该算法能够得到一个最近似独立的属性子集,从而放松朴素贝叶斯的条件独立性假设。 ,具有结构简单且计算高效等优点。然而,现实中的数据一般难以满足条件独立性假设前提,此为朴素贝叶斯方法的局限性。为了突破这一局限性以提高分类器的分类效果,通过属性选择来选择一组最近似独立的属性子集是一种有效的改进方法。本文的研究重点是通过属性选择来找到一组最大相关最小冗余的属性子集,所以在ASBCE属性约简算法的基础上,提出了一种基于粗糙集的选择性朴素贝叶斯分类模型RSSNBC。实验结果表明, 与经典朴素贝叶斯分类模型相比,RSSNBC模型取得了较好的分类正确率。 ,引入分类器集成学****技术将多个分类器通过某种方法组合,最终得到一个组合分类器。朴素贝叶斯分类模型是一种简单高效的概率统计分类方法,简单精确的分类方法非常适合作为集成学****的基分类器。由于朴素贝叶斯分类模型是一种稳定模型,所以在采用装袋(Bagging)集成算法中嵌入特征选择来增强个体分类器之间的差异性,提高个体分类器的泛化能力。在 ASBCE属性约简算法的基础上,提出了一种选择性朴素贝叶斯组合分类算法 SNBCE。实验表明,通过集成学****结合特征选择,该算法能更有效地提高分类器的分类效果。关键词:数据挖掘;朴素贝叶斯分类;粗糙集;属性选择;集成学****装袋 ABSTRACT Data mining istheresult ofthenatural evolution ofinformation technology,and is plex process ofextractingor”mining”hidden andpotential value knowledge fromthe large amounts datamining technologies,the data classificationisan important classificationmethod is akindofreasoning method thathas a solidmathematics theoreticalfoundationandhas aability ofintegratingpriorinformation and itssimple form Na'fve Bayesian method has the advantages ofsimple and effedtive andhasbeen widely paper analyses theclassificationprinciple andadvantages anddisadvantages ofthe Na'fveBayesian classificationalgorithm,and research the Na'fve Bayesian classification model from two ,this paper emphatically researchthrough attributeselection torelaxconditions independence limitationof themodel,and thenbased on thisintegrate ensemble learning technology toimprove paper mainly researchw