1 / 57
文档名称:

数据挖掘原理与算法01.ppt

格式:ppt   大小:603KB   页数:57页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘原理与算法01.ppt

上传人:小落意 2022/6/30 文件大小:603 KB

下载得到文件列表

数据挖掘原理与算法01.ppt

文档介绍

文档介绍:数据挖掘原理与算法01
LOGO
教材信息: 《数据挖掘原理与算法》 毛国君,段立娟,王实,石云 清华大学出版社,2019
本课程的一些约定:
1、课程目的:拓宽与加深专业知识
2、注重平时学****br/>作业按时完成
未g的关系,有不同的看法:
KDD看成数据挖掘的一个特例:这是早期比较流行的观点,这种描述强调了数据挖掘在源数据形式上的多样性。
数据挖掘是KDD的一个关键步骤:这种观点得到大多数学者认同,有它的合理性。
KDD与Data Mining含义相同:事实上,在现今的许多场合,如技术综述等,这两个术语仍然不加区分地使用着。也有其他的说法:
KDD在人工智能界更流行,而Data Mining在数据库界使用更多。
在研究领域被称作KDD,在工程领域则称之为数据挖掘。
数据挖掘定义
数据挖掘定义有广义和狭义之分。
从广义的观点,数据挖掘是从大型数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中,挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。
从这种狭义的观点上,我们可以定义数据挖掘是从特定形式的数据集中提炼知识的过程。
下列技术不是数据挖掘:
OLTP
Expert systems
Small ML
Statistical programs
数据挖掘研究的理论基础
数据挖掘方法可以是基于数学理论的,也可以是非数学的;可以是演绎的,也可以是归纳的。
从研究者可能是来自于数据库、人工智能、数理统计、计算机科学以及其他方面的学者和工程技术人员,他们会从不同的视点进行探讨性研究。
有下面一些重要的理论视点值得关注:
模式发现(Pattern Discovery)架构
规则发现(Rule Discovery)架构
基于概率和统计理论
微观经济学观点(Microeconomic View)
基于数据压缩(Data Compression)理论
基于归纳数据库(Inductive Database)理论
可视化数据挖掘(Visual Data Mining)
等等
第一章 绪论 内容提要
数据挖掘技术的产生与发展
数据挖掘研究的发展趋势
数据挖掘概念
数据挖掘技术的分类问题
数据挖掘常用的知识表示模式与方法
不同数据存储形式下的数据挖掘问题
粗糙集方法及其在数据挖掘中的应用
数据挖掘的应用分析
根据挖掘任务
分类或预测模型发现
数据总结与聚类发现
关联规则发现
序列模式发现
相似模式发现
混沌模式发现
依赖关系或依赖模型发现
异常和趋势发现等
根据挖掘对象
关系数据库挖掘
面向对象数据库挖掘
空间数据库挖掘
时态数据库挖掘
文本数据源挖掘
多媒体数据库挖掘
异质数据库挖掘
遗产数据库挖掘
web数据挖掘等
根据挖掘方法
机器学****方法
统计方法
聚类分析方法
神经网络(Neural Network)方法
遗传算法(Genetic Algorithm)方法
数据库方法
近似推理和不确定性推理方法
基于证据理论和元模式的方法
现代数学分析方法
粗糙集(Rough Set)或模糊集方法
集成方法等
根据知识类型
挖掘广义型知识
挖掘差异型知识
挖掘关联型知识
挖掘预测型知识
挖掘偏离型(异常)知识
挖掘不确定性知识等
第一章 绪论 内容提要
数据挖掘技术的产生与发展
数据挖掘研究的发展趋势
数据挖掘概念
数据挖掘技术的分类问题
数据挖掘常用的知识表示模式与方法
不同数据存储形式下的数据挖掘问题
粗糙集方法及其在数据挖掘中的应用
数据挖掘的应用分析
知识表示模式分类
数据挖掘的目的是发现知识,知识要通过一定的模式给出。通过对数据挖掘中知识表示模式及其所采用方法的分析,可以更清楚地了解数据挖掘系统的特点。
主要知识模式类型有:
广义知识(Generalization)
关联知识(Association)
类知识(Class/Cluster)
预测型知识(Prediction)
特异型知识(Exception)
广义知识挖掘
广义知识是指描述类别特征的概括性知识。这类数据挖掘系统是对细节数据的所蕴涵的概念特征信息的概括和抽象的过程。
主要方法有:
概念描述(Concept Description)方法:概念描述本质上就是对某类对象的内涵特征进行概括:
特征性(Characterization)描述:描述某类对象的共同特征。
区别性(Discrimination)描述:描述不同类对象之间的区别。
多维数据分析可以看作是一种广义知识挖掘的特例
多层次概念描述问题:由数据归纳出的概念是有层次的,不同层次的概念是对原始