1 / 6
文档名称:

DW-DM实验(李向东)Clementine6(分类2:神经网络).doc

格式:doc   大小:284KB   页数:6
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

DW-DM实验(李向东)Clementine6(分类2:神经网络).doc

上传人:Q+1243595614 2017/10/20 文件大小:284 KB

下载得到文件列表

DW-DM实验(李向东)Clementine6(分类2:神经网络).doc

文档介绍

文档介绍:Clementine 分类2:神经网络
【流7().str】
Clementine的B-P反向传播网络的应用
这里,以电信客户数据()为例,讨论神经网络的具体操作,分别目标是建立客户流失预测模型。
基本操作说明
在第5章数据基本分析的基础上,首先,在数据流中添加分区(Partition)节点,将样本集划分为训练样本集和检验样本集;然后,选择建模(Modeling)卡中的神经网络()节点并将其连接到数据流的恰当位置上,右击鼠标,选择弹出菜单中的编辑(Edit)选项进行参数设置,显示的对话框如图7-10 (a)所示。

(a) 参数设置对话框(b) 选项(Options)选项卡
图7-10 神经网络()的参数设置对话框及其选项(Options)选项卡
图7-10 (a)中具体参数设置如下。
●使用分区数据(Use partition data)选项:选中表示利用分区(Partition)变量将样本集分割后,只在训练样本集上建立模型,利用检验样本集计算模型误差。这里, 选择了该选项[本例数据流中已产生了分区(Partition)变量]。
●方法(Method)选项:Clementine提供了几种网络训练算法,。其中,快速(Quick)为快速训练法;Dynamic为动态增补法;Multiple为多层训练法;Prune为动态削剪法;RBFN为径向基函数网络,。
●预防过度训练样本%(Prevent overtraining Sample%)选项:选中表示在训练样本集中再随机抽取指定比例的样本训练模型,以克服过度拟合问题。如果希望随机样本重复出现,应选择设置随机数种子(Set random seeds)项。
●停止(Stop on)选项:用来指定迭代停止的条件。其中,默认值(Default)表示 Clementine自动决定迭代终止条件;准确性(%)[Accuracy(%)]表示当预测精度到达指定的值时才停止迭代;周期(Cycles)表示学习周期,即向样本学习指定的轮数;时间(分钟)[Time(mins)]表示当运行时间到达指定时间(分钟)附近时停止迭代。
●优化(Optimize)选项:表示计算过程中的内存利用策略。其中,速度(Speed)和内存(Memory)分别表示计算过程是否将中间计算结果临时存入磁盘,前者不存,效率较高;后者存放效率较低。
图7-10 (b)中具体参数设置如下。
●继续训练现有模型(Continue training existing model)选项:通常情况下,。
●使用二进制集编码(Use binary set encoding)选项:选中表示分类型输入变量转换处理时,采用二进制编码策略减少输入变量个数,。
●显示反馈图形(Show feedback graph)选项:选中表示模型训练过程中绘制预测精度曲线图以跟踪模型训练效果.
●模型选择(Model selection)选项中,使用最佳网络(Use work)表示最终得到一个预测精度最理想的模型;使用最终网络