1 / 20
文档名称:

DW-DM实验(李向东)Clementine1-2(数据读入).ppt

格式:ppt   大小:640KB   页数:20
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

DW-DM实验(李向东)Clementine1-2(数据读入).ppt

上传人:Q+1243595614 2017/10/20 文件大小:640 KB

下载得到文件列表

DW-DM实验(李向东)Clementine1-2(数据读入).ppt

文档介绍

文档介绍:Clementine 数据读入与集成
内容索引
变量类型
数据读入
生成实验方案数据
数据集成
变量类型(DM角度)
连续数值型(Range):如年龄
离散数值型(Discrete):如家庭人口数
实例化后,转为二分或多分类型。
二分类型(Flag):如性别
多分类型(Set):如职业
定序型(Ordered Sets):如学历和收入水平
缺省型(Default):尚未明确的变量类型
无类型型(Typeless):文字等复杂数据的变量,通常不参与建模。
非实例化变量:仅指定名称,未输入或读入具体变量值,系统默认缺省型。
实例化:系统根据所输入数据自动将缺省型改为上述其他类型,称变量实例化。
数据读入
源选项卡支持读入数据
自由格式文本文件
固定格式文本文件
Spss数据文件
SAS数据集
Excel电子表格
数据库文件等
读自由格式文本文件
使用“可变文件”节点
该节点没有数据展示功能,需使用“表”节点

读自由格式文本文件
文件选项卡
文件:指定文件夹和文件名
读取文件中的字段名:文件中第一行是变量名,选择该项,否则不选。
指定字段数:指定文件包含几个变量列。如文件以分隔符分割,系统可自动判断,常不选。
定界符:指定文件的列分隔符(一般为逗号),行分隔符(一般为新行)
读自由格式文本文件
数据选项卡
指定读入数据的基本类型等。
显示将要读入数据的变量名和系统根据数据判断出的变量存储类型。通常无需修改。
读自由格式文本文件
过滤选项卡
指定不读哪些变量
可重新修改变量名
读自由格式文本文件
类型选项卡
指定所读数据的变量类型,
并对变量的缺省值和取值合理性进行检查。
“读取值”按钮读入数据,称对节点实例化处理。窗口中的变量范围不能随文本文件的修改动态更新,只能重新实例化。
如只更新某个变量,在“值”下拉框中手工选择“读取”或“读取+”,再按“读取所有值”按钮。
读自由格式文本文件
注解选项卡
给节点命名和添加注释性文字。
名称:指定节点名称
工具提示文本:鼠标指到数据流编辑区的节点时,显示在此输入的说明文字。