1 / 46
文档名称:

人工智能数据挖掘.pptx

格式:pptx   大小:203KB   页数:46页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

人工智能数据挖掘.pptx

上传人:业精于勤 2022/7/29 文件大小:203 KB

下载得到文件列表

人工智能数据挖掘.pptx

文档介绍

文档介绍:第八章
数据挖掘
人工智能
华中师范大学计算机科学系
人工智能数据挖掘
第1页
第八章 数据挖掘
数据挖掘(Data Mining)是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学****统计学DD,而在工程领域则多称为数据挖掘。
人工智能数据挖掘
第6页
数据挖掘概述

数据挖掘方法能够是基于数学理论,也能够是非数学;能够是演绎,也能够是归纳。从研究历史看,它们可能是数据库、人工智能、数理统计、计算机科学以及其它方面学者和工程技术人员,在数据挖掘探讨性研究过程中创建理论体系。1997年,Mannila对当初流行数据挖掘理论框架给出了综述。结合最新研究结果,有下面一些主要理论框架能够帮助我们准确地了解数据挖掘概念与技术特点。
模式发觉架
规则发觉架构
基于概率和统计理论
微观经济学观点
基于数据压缩理论
基于归纳数据库理论
人工智能数据挖掘
第7页
数据挖掘概述

1.数据挖掘与传统分析方法区分
数据挖掘与传统数据分析(如查询、报表、联机应用分析)本质区分是数据挖掘是在没有明确假设前提下去挖掘信息、发觉知识。数据挖掘所得到信息应含有先未知,有效和可实用三个特征。
先前未知信息是指该信息是预先未曾预料到,既数据挖掘是要发觉那些不能靠直觉发觉信息或知识,甚至是违反直觉信息或知识,挖掘出信息越是出乎意料,就可能越有价值,在商业应用中最经典例子就是一家连锁店经过数据挖掘发觉了小孩尿布和啤酒之间有着惊人联络。
2. 数据挖掘和数据仓库
大部分情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中()。从数据仓库中直接得到进行数据挖掘数据有许多好处。
人工智能数据挖掘
第8页
数据挖掘概述
数据仓库数据清理和数据挖掘数据清理差不多,假如数据在导入数据仓库时已经清理过,那很可能在做数据挖掘时就没必要在清理一次了,而且全部数据不一致问题都已经被处理了。数据挖掘库可能是数据仓库一个逻辑上子集,而不一定非得是物理上单独数据库。但假如数据仓库计算资源已经很担心,那最好还是建立一个单独数据挖掘库
数据挖掘苦聪数据仓库中得出
人工智能数据挖掘
第9页
数据挖掘概述
3. 数据挖掘和在线分析处理(OLAP)
数据挖掘和OLAP是完全不一样工具,基于技术也大相径庭。OLAP是决议支持领域一部分。传统查询和报表工具是告诉人们数据库中都有什么,OLAP则更深入告诉人们下一步会怎么样和假如人们采取这么办法又会怎么样。用户首先建立一个假设,然后用OLAP检索数据库来验证这个假设是否正确。
数据挖掘与OLAP不一样地方是,数据挖掘不是用于验证某个假定模式(模型)正确性,而是在数据库中自己寻找模型。它在本质上是一个归纳过程。
数据挖掘和OLAP含有一定互补性。在利用数据挖掘出来结论采取行动之前,可能要验证一下假如采取这么行动会带来什么样影响,那么OLAP工具能回答这些问题。
人工智能数据挖掘
第10页
数据挖掘概述
4. 数据挖掘与机器学****和统计分析方法
数据挖掘利用了人工智能(AI)和统计分析进步所带来好处。这两门学科都致力于模式发觉和预测。数据挖掘不是为了替换传统统计分析技术。相反,它是统计分析方法学延伸和扩展。大多数统计分析技术都基于完善数学理论和高超技巧,预测准确度还是令人满意,但对使用者要求很高。而伴随计算机计算能力不停增强,我们有可能利用计算机强大计算能力只经过相对简单和固定方法完成一样功效。
一些新兴技术一样在知识发觉领域取得了很好效果,如神经元网络和决议树,在足够多数据和计算能力下,它们几乎不用人关照自动就能完成许多有价值功效。
人工智能数据挖掘
第11页
数据挖掘概述

伴随DM和KDD研究逐步走向深入,数据挖掘和知识发觉研究已经形成了三根强大技术支柱:数据库、人工智能和数理统计。所以,KDD大会程序委员会曾经由这三个学科权威人物同时来任主席。当前DMKD主要研究内容包含基础理论、发觉算法、数据仓库、可视化技术、定性定量交换模型、知识表示方法、发觉知识维护和再利用、半结构化和非结构化数据中知识发觉以及网上数据挖掘等。数据挖掘所发觉知识最常见有以下四类。
广义知识
关联知识
分类知识
预测型知识
人工智能数据挖掘
第12页
数据挖掘概述