1 / 12
文档名称:

678-数据挖掘及其工业应用.ppt

格式:ppt   页数:12
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

678-数据挖掘及其工业应用.ppt

上传人:小玉儿 2012/2/5 文件大小:0 KB

下载得到文件列表

678-数据挖掘及其工业应用.ppt

文档介绍

文档介绍:数据挖掘及其工业应用
答辩者: 胡铭
指导教师:杨涛
2010年6月3日
选题
意义: 数据挖掘技术的发展及其广泛应用
方法:阅读相关文献了解国内外数据挖掘发展状况,并加以实用举例分析。
2
论文结构
数据挖掘技术理论
起源,定义,数据特征,应用现状
数据挖掘应用实例
医药领域:两种聚类算法及其性能比较
证券领域:BP算法预测股市实例
3
数据挖掘理论
数据挖掘溯源及“尿布与啤酒”的故事
数据挖掘是从大量的数据中挖掘出隐含的,位置的,用户可能感兴趣的和对决策有潜在价值的知识和规则。这些规则蕴含了数据库中一组对象之间的特定关系,揭示出一些有用的信息,可以为经营决策、市场策划和金融预测等方面提供依据。
数据挖掘大体上有两种功能,即预测/验证功能和描述功能
应用十分广泛,从政府管理决策、商业经营、科学研究到工业决策支持
4
数据挖掘应用实例
在医药领域的应用
GK算法
5
两种聚类算法的比较
6
不同的聚类算法对同一数据集的聚类结果是不尽相同的,聚类效果和性能可以通过迭代步骤(IS)、分组指数(PI)、分离指数(SI)、XBI几个指标进行评价。如下表格所示。
IS PI SI XBI
GK聚类 70
FCM聚类 34
7
迭代步骤:两种方法都是迭代算法,由上表可以看出GK聚类算法没有FCM快,因为GK是距离自适应而后者是距离固定的。
分组指数:它是每个分组紧致性和分离度比值之和,在比较有相同聚类个数方法的分组有效性是非常有用的。
分离指数:它是每个分组的紧致性与最小距离分离度比值之和。
XBI:它是衡量每个类的紧致性和类与类之间的分离性的指标。
由以上表格中的对比可以看出,GK算法得出的每个类是紧致的,类之间的分离度较高,因此聚类效果好。
8
BP算法预测股市
9
10