1 / 12
文档名称:

DW-DM实验(李向东)Clementine9-多模型联合建模.doc

格式:doc   大小:760KB   页数:12
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

DW-DM实验(李向东)Clementine9-多模型联合建模.doc

上传人:Q+1243595614 2017/10/20 文件大小:760 KB

下载得到文件列表

DW-DM实验(李向东)Clementine9-多模型联合建模.doc

文档介绍

文档介绍:Clementine 多模型联合建模
<comes from :SPSS 中文版教程 >
一、二元目标自动建模
对客户响应简模(二元分类器)【】
通过二元分类器节点,您可以自动创建和比较大量结果为二元(是或否)的不同模型,例如某个客户是否很可能拖欠贷款或者是否会对特定的报价做出响应。通过一个相对简单的流,您可以生成一组候选模型并对它们进行排序,选择最有效的模型,然后使用整体节点将它们合并为一个汇总模型。此方法将自动化操作的方便性与组合多个模型的优势融为一体,从而产生任何单一模型所不能带来的更为准确的预测。
本示例以某公司为例,该公司希望通过为每个客户提供最适用的报价以获取更丰厚的收益。所使用的数据文件为 。
文件 的历史数据可跟踪过去的营销活动中为特定客户提供的报价,由 campaign 字段的值表示。Premium account 活动中的记录数最大。campaign 字段的值在数据中实际编码为整数,并带有类型节点中定义的标签(例如 2 = Premium account 保险费账户)。
此文件还包含一个响应字段response,该字段表明所提供的报价是否被接受(0 = 否,1 = 是)。这将是您希望预测的目标字段或值。
此外,其中还包括若干包含每位客户的相关人口统计和财务信息的字段。这些字段可用于构建或“训练”一个可基于类似收入、年龄或每月交易次数等特征预测单个用户或用户群响应率的模型。
构建流
添加指向 的 SPSS 源节点。(您可以在文件路径中指定$CLEO_DEMOS/ 作为引用此文件夹的快捷方式。请注意,路径中必须使用正斜线而非反斜线,如上文所示。)见下图。
添加类型节点,然后选择响应作为目标字段(“方向”为输出)。将此字段的“类型”设置为标志。对于以下字段,应将“方向”设置为无:customer_id、campaign、response_date、purchase、purchase_date、product_id、Rowid 和 X_random。当您构建模型时,将忽略这些字段。单击类型节点的读取值按钮以确保值获得实例化。(说明,也可以直接使用SPSS 源节点实现上述设置,不用添加类型节点。见下图。)
尽管数据包含有关四项不同活动的信息,但每一次的分析应集中关注其中一项活动。由于 Premium conditions 活动(在数据中编码为 campaign=2)中的记录数最大,因此可以使用选择节点实现仅在流中包含这些记录。见下图。
附加一个二元分类器节点,然后选择总体精确性作为对模型进行排序的度量。见下图。
在“专家”选项卡上,取消选中判别式和 SVM 模型类型。(这些模型需要花费更多时间培训这些数据,因此取消选中它们将可以加快示例的执行速度。如果不介意等待一至两分钟,也可以保留它们的选中状态。)节点将为每个剩余的算法估计一个模型,总共要估计八个模型。见下图。
执行后显示一个报告,其中列出了运行期间每个评估模型的详细信息。浏览结果并为希望使用或进一步探索的任意模型生成建模节点、模型块或评估图表。见下图。
默认情况下,模型会基于总体精确性排序,因为这是在二元分类器节点中选择的度量。根据这一度量,C51() 模型的精确性最高,但其他多个模型的精确性与之相差不大。可以通过单击其他列的标题对该列进行排序,或者也可以从工具栏的排序方式下拉列表中选择所需的度量。
根据这些结果,生成三个准确性最高的模型,将它们添加到流中,然后使用整体节点将它们组合到一起。通过结合多个模型的预测,可以避免单个模型的局限性,从而使整体准确性更高。
在“生成”列中选择“C51”、“C&R 树”和“神经网络”模型,然后从菜单中选择: 生成。将模型添加至选项板。
生成的模型块将添加到窗口右上角的“模型”选项板中,可以在此浏览它们、将它们添加到流中,或者采用多种其他方式保存或部署它们。见下图。
依次右键单击每个模型以将其添加到流中。见下图。
将这三个模型块附加到选择节点,在附加了二元分类器节点的点上对流进行分支操作。在第三个模型之后附加一个整体节点(“字段选项”选项板)。见下图。
在整体节点中,选择响应作为目标字段,并且确保未选中过滤出整体模型生成的字段。这样就可以将每个单独模型的得分与合并的整体得分进行比较。见下图。
对于整体方法,请选择置信度加权投票。此选项确定如何为每条记录生成一个汇总得分。使用简单投票方式时,若三个模型中有两个模型均预测是,则是将以 2 比 1 的

最近更新

2025年重庆能源职业学院单招职业适应性测试模.. 43页

2025年防城港职业技术学院单招职业适应性考试.. 45页

2025广东佛山禅城实验高级中学招聘宿舍生活老.. 45页

2025广东湛江市吴川市县域医疗卫生共同体招聘.. 46页

2025广西桂林市临桂区招聘区管国有企业领导人.. 46页

2025江苏无锡市久安砼业有限公司招聘5人参考题.. 45页

2025雄安人才服务有限公司党群工作岗招聘1人备.. 48页

2026年c语言基础知识试题必考题 13页

2026年c语言理论考试题(轻巧夺冠) 13页

2026年c语言试题期末(培优a卷) 13页

2026年中医住培带教师资理论考核题库100道含答.. 39页

2026年党风廉政建设知识测试题(夺分金卷) 14页

2026年哈尔滨传媒职业学院单招职业倾向性考试.. 43页

2026年大一c语言期末试题及1套参考答案 13页

2026年宁夏工业职业学院单招职业技能考试模拟.. 45页

2025年西昌民族幼儿师范高等专科学校单招综合.. 43页

吉水县司法局2025年面向社会公开招聘10名司法.. 49页

基于四个“四”的初中语文数字化资源的设计与.. 32页

基于电子舌和HS-SPME-GC-MS技术的不同产地青钱.. 8页

2025广东湛江吴川市招聘大学生乡村医生28人参.. 44页

2025交通运输部所属事业单位第七批统一招聘10.. 18页

2025年新疆考试录用公务员《公安专业科目》真.. 30页

ALC墙板蒸压加气轻质混凝土板材安装施工方案及.. 3页

GBT228-2024金属材料室温拉伸试验方法 39页

单招考试-计算机网络技术期末试卷(带答案) 14页

沪科版八年级-《压强》单元测试题(含答案) 7页

企业承包商准入与退出机制 11页

隐仙派子平命法传人班,老海秘本面授资料 22页

心思的战场-乔依丝迈尔 50页

广州南沙经济技术开发区管理委员会办公室.doc.. 21页