1 / 3
文档名称:

数据挖掘论文3000字范文参考,计算机应用技术论文.doc

格式:doc   大小:51KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘论文3000字范文参考,计算机应用技术论文.doc

上传人:小博士 2018/7/10 文件大小:51 KB

下载得到文件列表

数据挖掘论文3000字范文参考,计算机应用技术论文.doc

文档介绍

文档介绍:数据挖掘论文3000字范文参考,计算机应用技术论文
数数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学****专家系统和模式识别等诸多方法来实现上述目标。本文精选几篇关于数据发掘论文范文供大家学****一下。
数据挖掘论文一:
《数据挖掘中的属性选择偏差抑制算法研究》摘要:,,,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,,与经典的ID3方法相比,,随着数据样本数量的增大,该文方法的执行时间大为降低.
关键词:数据挖掘;决策树;属性选择;偏差抑制
信息化技术的飞速发展,使得人们获得信息的渠道日益丰富,,并从中寻找到对自己有价值的信息至关重要,这就推动了数据发掘技术的不断进步[1].近年来,数据挖掘技术形成了重要的分支:基于决策树的挖掘方法、基于贝叶斯分类的挖掘方法、基于遗传算法的挖掘方法、基于神经X络的挖掘方法[2-4].
在这几大类方法中,基于决策树的挖掘方法应用最为广泛,这是因为决策树方法具有抑制噪声的能力,执行速度快,并且适合于各种规模的数据集合[5].决策树算法根据不同的属性对数据对象进行分类或测试,其中ID3型决策树算法是比较有代表性的挖掘算法之一[6].ID3型决策树采用了一种分治策略,依托信息熵理论并通过迭代分类器实现数据自动分类[7].
郭亦东等[8]在口令分析中使用了数据挖掘技术,并构建了一种基于剪枝决策树的挖掘方法,此方法中设计了节点代价的目标函数,并详细地设计了节点扩展、剪枝规则,[9]采取二分挖掘策略代替传统的线性挖掘策略,并对决策判断的局部阈值进行了分级改进,[10]将模糊决策理论引入数据挖掘领域中的决策树构建,并证实模糊决策可以进一步提升决策树的归纳和推理能力.
基于决策树的数据挖掘方法依赖于准确的属性设置和表达,为了进一步提升决策树挖掘方法的准确率,本文对决策树挖掘过程中的属性选择偏差抑制问题进行探讨,以期得到具有更优秀性能的挖掘方法.
1、基于属性选择偏差抑制的决策树挖掘算法
在一个挖掘算法中,,决策树就可以精炼,、设置最精简的决策树是一个典型的NP问题(Non-Deterministic Polynomial,非确定多项式问题),,在数据分类过程中区分能力不能达到最准确,并且启发式策略执行依靠的计算复杂程度过高.
这里,数据分类的信息量一共有n个,分别用d1,d2,,,公式(1)的计算过程涉及了多次对数运算,当参与挖掘的数据量过大时,