文档介绍:%
广东商学院信息学院
%
广东商学院信息学院
数据仓库与数据扌它掘
Chapter 10:
复杂数据类型的挖掘
广东商学院信息学院胡建军
%
广东商学院信息学院
%
广东商学院信息学院
1 /93
2021 年4 月 29 H
Course Outline
Course Outline
2021年4月29日 广东商学院信息学院 4/72
2021年4月29日 广东商学院信息学院 3/72
复杂数据对象的多维分析和描述性挖掘 空间数据库挖掘
多媒体数据库挖掘
时序数据和序列数据的挖掘
文本数据库挖掘
Course Outline
Course Outline
2021年4月29日 广东商学院信息学院 4/72
2021年4月29日 广东商学院信息学院 5/72
Web挖掘
复杂数据对象的多维分析和描述性挖掘
空间数据库挖掘
多媒体数据库挖掘
时序数据和序列数据的挖掘 文本数据库挖掘
Course Outline
Course Outline
2021年4月29日 广东商学院信息学院 4/72
2021年4月29日 广东商学院信息学院 5/72
Web挖掘
2021年4月29日 广东商学院信息学院 6/72
2021年4月29日 广东商学院信息学院 #/72
数据挖掘的对象
简单数据
关系数据库、事务数据库、数据仓库
复杂类型数据
复杂对象、空间数据、多媒体数据、时间序 列数据、文本数据、Web数据等
挖掘技术:基本挖掘技术的扩展
针对复杂数据类型的新技术 实施知识挖掘的方法
2021年4月29日 广东商学院信息学院
2021年4月29日 广东商学院信息学院
复杂数据对象的多维分析和描/
述性挖掘 Y
2021 年4 月 29 H 广东商学院信息学院 7/72
商品化数据仓库和OLAP工具用于多维分析的局
限:
维 非数字数据
度量 聚集值
复杂数据对象的概化及其概化数据的应用
复杂数据的组织及存储方法
2021年4月29日 广东商学院信息学院
2021年4月29日 广东商学院信息学院
复杂数据对象的多维分析和描/
述性挖掘 Y
2021 年4 月 29 H 广东商学院信息学院 7/72
类、类/子类
对象:对象标识、属性、方法
复杂结构数据的概化
复杂结构数据:
集合、元组、列表、树、记录等及其组合; 概化方法:
保持原结构不变,概化其属性
2021年4月29日 广东商学院信息学院
2021年4月29日 广东商学院信息学院
复杂数据对象的多维分析和描/
述性挖掘 Y
2021 年4 月 29 H 广东商学院信息学院 7/72
把原结构扁平化,概化扁平化的结构 用高层概念或聚集汇总低沉结构 返回原结构的类型或概貌
复杂数据对象的多维分析和描/
述性挖掘 Y
2021 年4 月 29 H 广东商学院信息学院 #/72
集合值
集合值
一般概化方法:
将集合中的每个值概化为其对应的更高级别的概 念
导出集合的一般特征(元素个数、区间、平均值 、最大值等)
示例:业余爱好{网球,曲棍球,国际象棋,小提琴,任天 t堂游戏}
妇化:{体育,音乐,电子游戏}