1 / 236
文档名称:

《智能优化算法及其应用》王凌.pdf.pdf

格式:pdf   页数:236页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

《智能优化算法及其应用》王凌.pdf.pdf

上传人:jactupq736 2016/7/14 文件大小:0 KB

下载得到文件列表

《智能优化算法及其应用》王凌.pdf.pdf

文档介绍

文档介绍:第 2 章从商务角度看数据挖掘程春明 chengcm@ 《数据挖掘》课件内容提要? 引言? 从数据挖掘工具到解决方案? 数据挖掘系统的演变? Crisp-DM 模型? 数据挖掘支撑技术概述? 数据挖掘技术 引言?商业数据是如何进化为有用商业信息的? ?信息技术发展一个新的重要趋势是识别信息系统中有意义的数据。?这种知识可能是一个商业机构获得竞争优势的关键。? DM 的价值在于主动搜寻产业发展趋势,并将这种理解提供给拥有大量信息的机构。?商务机构的数据挖掘目标主要是改善组织机构与它们的顾客之间的沟通质量。?数据挖掘在人的控制下,使用算法从数据中提取模式。可以为组织机构提供一种优化商务数据处理的方法?企业(组织)数据更加全面,生产、销售、质量?数据挖掘公司关注各个不同的行业?对大型、超大型、复杂的数据进行数据挖掘? DM 可以用于商务应用,依靠三种成熟技术所支持?大量数收集?功能强大的多处理器计算机?数据挖掘算法数据挖掘演变进化阶段数据搜集(60 年代)数据访问(80 年代)数据仓库决策支持(90 年代)数据挖掘(正在流行) 商业问题“过去五年中我的总收入是多少? ”“在新英格兰的分部去年三月的销售额是多少?”“在新英格兰的分部去年三月的销售额是多少?波士顿据此可得出什么结论? ”“下个月波士顿的销售会怎么样?为什么? ”支持技术计算机、磁带和磁盘关系数据库(RDBMS) 结构化查询语言(SQL) ODBC 联机分析处理(OLAP) 多维数据库数据仓库高级算法多处理器计算机海量数据库产品厂家 IBM CDC Oracle Sybase Informix IBM Microsoft share Arbor Cognos Microstrategy Pilot Lockheed IBM SGI 其他初创公司产品特点提供历史性的、静态的数据信息在记录级提供历史性的、动态数据信息在各种层次上提供回溯的、动态的数据信息提供预测性的信息?数据挖掘产业的一个持续趋势是企业资源计划( ERP )零售商和应用服务提供者( ASP )的出现。?什么是 ERP ? 数据挖掘工具及解决方案?数据挖掘可以沿三条谱线追溯?经典统计学(基础) ?回归分析、正态分布、标准差、标准方差、聚类分析和置信区间等概念,主要用于研究数据与数据之间的关系,这些都是最基本的构件块,可以用来构建更高级的统计分析。?人工智能( Artificial Intelligence , AI) ?机器学****统计学与 AI的结合) ? DM 基本上是将机器学****用于商务和科学应用,最好将 DM 看作统计学、 AI、机器学****过去和现在发展的融合。 数据挖掘系统的演变?典型数据挖掘系统的体系结构数据仓库数据清洗过滤数据库数据库或数据仓库服务器数据挖掘引擎模式评估图形用户界面知识库数据集成数据挖掘系统的演变?第一代:数据挖掘系统( data mining system ) , 20 世纪 80 年代。?主要关注单一任务的、研究驱动的工具组成?操作复杂?结果表示和可视化效果不理想?第二代:数据挖掘系统套装(suite),1995 年。?关注数据清理和预处理?集成了数据处理及可视化表示等功能? Clementine 、 Mineset 、 Intelligent Miner ?第三代:基于应用和解决方案的从生产到销售全过程的数据挖掘, 20 世纪 90 年代。?解决具体的商务问题,筛选存储在大型数据库中的信息,发现隐藏的模式。通过决策支持系统集成数据挖掘系统,能对特定的问题进行决策,忽略数据挖掘工具的细节。?面向生产到销售的全过程?电子商务 Crisp-DM 模型?跨行业数据挖掘标准流程(Cross-Industry Standard Process for Data Mining , Crisp-DM) 数据挖掘方法论最初由 SPSS 、 NCR 和 DaimlerChrysler 三个公司在 1996 年提出。后来得到欧共体研究基金的支助。到 2000 年8月, Crisp- DM 版发布。 Crisp-DM 不是一种描述特定数据挖掘的技术,而是描述数据挖掘项目生命周期的流程。