文档介绍:常用数据挖掘方法----神经网络第四组:张诗慧肖召红王成钟辉健陈嘉楠
神经网络
索引
数据挖掘
定义: 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
任务:数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。
方法: 数据挖掘涉及多学科技术的集成,包括数据库技木、神经网络、模式识别、信息检索、图像与信号处理和问数据分析等.
目前,神经网络在数据挖掘中的应用越来越广泛。
什么是神经网络?
人工神经网络是由大量简单的基本元件----神经元相互联结,模拟人的大脑神经处理信息的方式,,使其具有人的大脑的记忆、辨识能力,、自适应、联想记忆、并行处理和非线形转换的能力,避免了复杂数学推导,在样本缺损和参数漂移的情况下,仍能保证稳定的输出,人工神经网络这种模拟人脑智力的特性,受到学术界的高度重视和广泛研究,已经成功地应用于众多领域,如数据挖掘、模式识别、图象处理、智能控制、虚拟现实、优化计算等领域。
神经网络的优缺点
优点:
。
。
。
。
缺点:
1. 结构复杂、可解释性差
2. 训练时间长
3. “黑箱”性,人们难以理解网络的学****和决策过程。
(神经网络模拟人脑结构。象大脑一样,神经网络从一组输入数据中进行学****根据这一新的认知调整模型参数,以发现数据中的模式。)
神经网络方法分类
典型的神经网络模型按照网络拓扑结构和运行方式主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈递归式神经网络模型;以art模型、koholon模型为代表的,用于聚类的自组织映射模型(随机型网络模型)。
基于神经网络的数据挖掘由数据准备、规则抽取和规则评估三个阶段组成:
神经网络模型工作的具体流程
1数据准备
数据准备就是对被挖掘的数据进行定义、处理和表示,,.
(1)数据清洗:数据清洗就是填充数据中的空缺值,消除噪声数据,纠正数据中的不一致数据.
(2)数据选择:数据选择就是选择用于本次挖掘的数据列和行.
(3)数据预处理:数据预处理就是对选择后的干净数据进行增强处理.
(4)数据表示:,因此需要将符号数据转化为数值数据.
规则的抽取方法很多,其中最为常用的方法有:LRE的方法、黑盒的方法、抽取模糊规则的方法、从递归网络中抽取规则的方法、二值输入输出规则抽取算法(BIO—RE)、部分规则算法(删a1一RE)以及全部规则抽取算法(Full—