1 / 4
文档名称:

基于粗集和神经网络的混合数据挖掘方法.doc

格式:doc   页数:4
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于粗集和神经网络的混合数据挖掘方法.doc

上传人:小泥巴 2014/3/14 文件大小:0 KB

下载得到文件列表

基于粗集和神经网络的混合数据挖掘方法.doc

文档介绍

文档介绍:精度GPS应用研究报告讲座基于粗集和神经网络的混合数据挖掘方法颜菲[摘要]在处理大数据量,消除冗余信息等方面,粗集理论有着良好效果。而神经网络则具有独特的模型结构和固有的非线性模拟能力,以及高度的自适应和容错特性等突出特征。因此,两种技术的有效结合是近几年数据挖掘领域的一个研究热点。本文提出了一个新的混合挖掘方法。[关键词]数据挖掘粗集神经网络一、引言随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为公司创造很多潜在的利润,而这种从海量数据库中挖掘信息的技术,就称之为数据挖掘(DataMining-DM)。[1]粗集理论是一种刻画不完整性和不确定性信息的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[2]。粗集理论以观察和测量所得的数据并进行分类的方法为基础,它认为知识是基于对对象分类的能力,知识直接与真实或抽象世界有关的不同分类模式联系在一起。粗集用上近似、下近似和边界来刻画信息的不确定性。神经网络是通过网络中各连接权值的改变,实现信息的处理和存储。在神经网络中每个神经元既是信息的存储单元,又是信息的处理单元,信息的处理与存储合二为一,由这些神经元构成的网络在每个神经元的共同作用下,完成对输入模式的识别与记忆。人工神经网络以神经元间广泛的互连分布来存贮信息,以非线性神经元来协同处理信息。因此,它具有大规模并行处理、极强的鲁棒性和容错性,很强的自学习功能。二、粗集和神经网络集成方法概述由于粗集和神经网络具有很强的优势互补性,因此将两种技术的有效结合是当前的一个研究热点,已引起了许多学者的广泛关注。目前常用的有如下几种结合方式:(1)将粗集作为神经网络的前端处理器(2)强耦合方式:即先用粗集分析决策表得到初始规则,然后用神经网络精化。(3)粗神经网络:在普通BP网的输入层和隐层之间加一个粗神经元(全互连接),以抑制输入层数据的波动。(4)用粗集优化神经网络的结构。除上述结合模式外,还存在许多新的集成方式。在现行的各种结合方式中,粗集理论的属性约简是其中的重要组成部分之一,通过用其对神经网络的训练数据进行约简,减少网络学习所需数据量,达到进一步改善神经网络学习效率和精度的目的。然而在实际应用中,对于一些规模较大的网络,粗集的处理效率还值得深入研究。由于基于并行遗传算法的属性约简方法可有效解决数据量大、维数多时的快速约简问题,因而我们可考虑首先用其对神经网络的输入空间进行快速选取,在此基础上用神经网络进行数据挖掘,以进一步提高应用粗集和神经网络对大型实际数据库进行挖掘时的效率。三、一种新的集成化算法的实践基于前述分析,本文设计了一种粗集理论和神经网络的组合模型,通过对某超市客户特征分析的精度GPS应用研究报告讲座应用,验证了该模型的性能优于传统的粗糙集和一般的神经网络模型。(一)建模思想对样本数据进行分析,然后据己知的领域知识形成一个初始的信息表,采用合理的离散方法对连续属性进行离散化,用基于遗传算法的并行约简算法对数据进行快速属性约简(水平约简),以约简后的属性作为输入层神经元,然后对数据进行垂直约简,包括消除数据中的不一致对象和冗余对象,最后用神经网络对处理后的精简数据进行训练。并行约简