1 / 33
文档名称:

spss数据挖掘方法概述.doc

格式:doc   大小:804KB   页数:33页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

spss数据挖掘方法概述.doc

上传人:wdggjhm62 2021/10/12 文件大小:804 KB

下载得到文件列表

spss数据挖掘方法概述.doc

文档介绍

文档介绍:- .
28
- . 可修编.
数据挖掘方法概述
一、主要概念1
二、主要方法概述1
1、神经网络方法概述1
2、聚类方法概述9
3、主成分分析14
4、决策树概述17
5、关联分析21
6、遗传算法概述23
一、主要概念
1、数据挖掘〔data mining,简记DM〕:采取专门算法对数据库中潜在的、不明显的数据关系进展分析与建模。
2、CRISP-DM(CRoss-Industry Standard Process for Data Mining):各企业中被广泛采用的数据挖掘标准流程。包括6个步骤:商业理解、数据理解、数据准备、模型建立、结果评估、应用部署。
3、Clementine:SPSS公司推出的企业级数据挖掘软件产品,其包括的数据挖掘主要方法为:神经网络、聚类分析、主因子分析、决策树分析、关联分析、回归分析。
二、主要方法概述
1、神经网络方法概述
主要问题:〔1〕什么是神经网络?
〔2〕神经网络有什么用?
〔3〕如何建立神经网络?
〔4〕如何应用神经网络?
〔1〕人工神经网络
“人工神经网络〞(ARTIFICIAL NEURAL NETWORK,.)是基于模仿大脑神经网络构造和功能而建立的一种信息处理系统。神经网络在一定学****规那么下,对提供的学****样本进展学****从中获取特征信息,并存储〔记忆〕在相应的权值及参数上。学****后,对于新的输入数据,网络可通过已获取的权值及参数,计算网络的输出。神经网络具有高度的非线性、容错性与自学****自适应更新等功能,能够进展复杂的逻辑操作和非线性关系实现。目前神经网络模型在辅助管理与决策中,应用广泛。
〔2〕神经网络的作用
- .
2
- . 可修编.
已证明结论:对于函数,在满足一定条件下,可以找到函数和实常数和,构造函数:
使对于任意小的,满足
〔3〕简单神经网络模型〔感知机模型〕的建立
问题引入:设想对购置手机的顾客制定销售方案,用购置量与购置频率两个指标来判别,即:
购置量大, 购置频率大,那么给予优惠折扣 ;
购置量大, 购置频率小,那么给予优惠折扣 ;
购置量小, 购置频率大,那么给予优惠折扣 ;
购置量小, 购置频率小,那么不给予优惠折扣
问题:这样的销售方案判别是否可以建立模型表示?
设想:分别对购置量、购置频率以及是否优惠的两种取值定义为1,0,那么上述四种方案可以用四个样本表示,设每一样本具有两个评价指标X1,X2,一个评价结果Y:
样本号 X1, X2 Y
1 1 1 1
2 1 0 1
3 0 1 1
4 0 0 0
构造两个输入节点、一个输出节点、二层构造的神经网络模型:
〔*〕 O1=f( xj取值1或0,
w1j〔j=1,2〕待求
作用函数:f(x)= 1 x>0
0 x≤0
构造:
X1○ W11 X1
○ Y
- .
28
- . 可修编.
X2○ W12 X2
学****样本:( x1(k),x2(k), Y1(k) ) , k是样本数, k=1,2,3,4
关键问题:如何获取模型〔*〕中的权数w1j,使计算结果与样本的评价结果的误差最小?
计算w1j方法:
随机赋予w1j初始值,通过对每一样本的学****获