1 / 7
文档名称:

数据挖掘与标准化流程.pdf

格式:pdf   大小:126KB   页数:7页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘与标准化流程.pdf

上传人:雪雁 2021/12/24 文件大小:126 KB

下载得到文件列表

数据挖掘与标准化流程.pdf

相关文档

文档介绍

文档介绍:数据挖掘与标准化进程
• CRISP-DM (CRoss-Industry Standard Process for Data
Mining )
– 数据挖掘过程标准化
• XML(Extensible Markup Language)
– 与数据预处理相结合,表示数据
• SOAP (Simple Object Access Protocol )
– 数据库与系统互操作的标准
• PMML(Predictive Model Markup Language)
– 预言模型交换标准, ,利用XML 描述和存储数据挖掘模型
• OLE DB For Data Mining
– 数据挖掘系统基于API 的接口,可算为通用数据挖掘语言
– 2000 年3月,微软公司推出了一个数据挖掘语言
数据挖掘标准流程
• CRISP-DM (CRoss-Industry Standard Process -Data
Mining ),在1996 年制定,是当今数据挖掘业界通用流行
的标准之一, 强调数据挖掘在商业中的应用,解决商业
中存在的问题,而不是把数据挖掘局限在研究领域
• 流程内容
– 商业理解
– 数据理解
– 数据准备
– 建立模型
– 模型评估
– 模型发布
数据挖掘流程
• 商业理解(Business Understanding)
– 确定目标,对现有资源评估,确定问题是否能够通过
数据挖掘来解决,确定数据挖掘的目标,制定数据挖
掘计划
• 数据理解(Data Understanding)
– 确定数据挖掘所需要的数据,对数据进行描述,数据
的初步探索,检查数据的质量
• 数据准备(Data Preparation)
– 选择数据,清理数据,对数据进行重建,调整数据格
式使之适合建模
数据挖掘流程
• 建立模型(Modeling)
– 对各个模型进行评价,选择数据挖掘模型,建立模型
• 模型评估(Evaluation)
– 评估数据挖掘的结果,对整个数据挖掘过程的前面步
骤进行评估,确定下一步怎么办?是发布模型?还是
对数据挖掘过程进行进一步的调整,产生新的模型
• 模型发布(Deployment )
– 把数据挖掘模型的结果送到相应的管理人员手中,对
模型进行日常的监测和维护,定期更新数据挖掘模型
预言模型交换标准PMML
<!- - model in PMML format - ->
数据挖掘算法 <PMML version=""
<TreeModel ModelName = "golf"
数据源