文档介绍:word
word
标准文档
word
SPSS Clementines 预测分析模型----啤酒+尿片故事的实现机理〔使用11版本实现〕
SPSS Clenmentines提供众多的预测模型,这使得它们可以应用在多种商业领域        F
4                         F                          F                   F                 T
关联规如此挖掘算法
Aprior、Carma 和序列节点是常用的关联规如此挖掘算法,它们都可以使用交易格式和表格格式数据进展挖掘处理。其中 Aprior 算法,处理速度快,对包含的规如此数没有限制,是一种最有影响的挖掘关联规如此的方法。
本次试验将使用SPSS Clementine11 自带的安装目录下的 Demos 文件夹下的 BASKETS1n 数据。希望分析出哪些商品会和啤酒一起购置,以此来合理安排商品的摆放,进而提高啤酒的销量。
此数据属于表格格式数据,每条记录表示顾客的一次购物。记录的字段包括卡号、顾客根本信息、付款方式和商品名称〔每个商品一个字段 , 该商品字段值为 T, 表示购置该商品 , 值为 F 表示未购置,具体可参考表 2, 表格格式数据〕。商品名称都有 fruitveg〔水果蔬菜〕,freshmeat〔生鲜肉〕,dairy〔奶制品〕,cannedveg〔罐装蔬菜〕,cannedmeat〔罐装肉〕,fozenmeal〔冻肉〕,beer〔啤酒〕, wine〔酒类〕,softdrink〔软饮〕,fish〔鱼〕, confectionery〔甜食〕。
首先打开Clementine ,会出现一X空白的流界面,这时用户可以在里面创建自己的流。
word
word
标准文档
word
第一步,为流添加一个数据节点,这里选择 Clementine自带的 Demo 数据。将界面下方选项卡的“数据源〞选项中的“可变文件〞拖放到空白界面中,双击打开,在文件选项卡中选择 Clementine 自带的 Demo 数据BASKETS1n,如下列图。
点击确定按钮,这时就成功的创建了数据节点。
第二步,为流添加类型节点,类型节点是显示和设置数据每个字段的类型、格式和角色。从界面下方的“字段选项〞卡中,将“类型〞节点拖放到界面中,接着将数据节点和类型节点连接起来,或者直接在“字段选项〞卡中双击“类型〞节点,将两者连接起来。这时双击打开“类型
word
word
标准文档
word
〞节点,此时“类型〞节点中显示了数据的字段和其类型,点击“类型〞节点界面上的“读取值〞按钮,这时会将数据节点中的数据读取过来。如如下图所示。
接着可以为参与建模的数据字段设置角色,角色分“输入〞,“目标〞,“两者〞和“无〞。输入表示该字段可供建模使用,目标表示该字段为建模的预测目标,两者表示该字段为布尔型的输入字段,无表示该字段不参与建模。Apriori 节点需要一个或多个输入字段和一个或多个目标字段,输入字段和输出字段必须是符号型字段。在此可以选择一个或多个字段为目标字段,明确该模型的预测目标字段;对于 Apriori 建模节点,也可以不设置目标字段,如此需要在建模节点中设置“后项〞。
第三步,为流添加 过滤节点,将不参与的字段排除在外。该步骤为可选步骤。从“字段选项〞卡中选择“过滤〞节点,并将其拖入到界面中,将“过滤〞节点参加到流中。双击打开“过滤〞节点,在不参与建模字段的箭头上点击,会出现一个红叉,表示该字段被过滤掉了,不参与建模,如下列图。
word
word
标准文档
word
对于一些与建模关系不大的节点可以将其过滤掉,比如卡号、性别、家乡和年龄字段。
第四步,有了这些前期的准备过程,接下来就可以开始创建关联规如此模型节点了,在此之前,让我们先添加一个图形节点—— 网络节点,建立此节点的目的是为了让用户首先可以直观的看到商品之间的关联程度,有一个感性认识。选择“图形〞选项卡中的“网络〞节点,将此拖入界面,将“网络〞节点参加流中,与“过滤〞节点连接起来。双击打开网络节点,在“字段〞列表中选择添加字段,可以将所有的商品字段添加进来;也可以点击“仅显示真值标志〞,将只显示那些“两者〞的字段,如下列图。
word
word
标准文档
word
点击“选项〞卡,进入选项设置,用户可以在此设置数量的显示X围,不显示一些数量低的,如下列图。
点击“运行〞按钮,这时会生成一个商品之间关联程度〔数量〕的网络图,用户可以在下方的调节杆上调节数量的显示X围。
word
word
标准文档
word
上图中,线的粗