1 / 29
文档名称:

金融数据挖掘.ppt

格式:ppt   大小:1,429KB   页数:29页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

金融数据挖掘.ppt

上传人:文库新人 2021/11/29 文件大小:1.40 MB

下载得到文件列表

金融数据挖掘.ppt

相关文档

文档介绍

文档介绍:金融数据挖掘
第一页,课件共29页
第一章:概论
一、何为数据挖掘(data mining)
现代信息社会的特征:信息(数据)泛滥、知识缺乏,如何从海量数据(广义的概念)中挖掘出决策有用信息?

数据挖掘是结合现代数学、统计学,机器学****人工智能、数据库管理、计算机图形学、软件工程等各领域的技术和知识,1990年代在西方国家出现的一种高新技术——从海量数据中挖掘出决策有用信息的技术。
1990年代末,在对100名美国著名科学家的问卷调查中,数据挖掘被列为21世纪对人类发展影响最大、最有前途的10大技术的第三位。
第二页,课件共29页
我国对数据挖掘技术的重视(开发与应用)

1、863、963项目;
2、国家及省重点科学领域;
3、国家统计局在全国组织数据挖掘培训(2000);
4、企业特别是银行对数据挖掘技术的重视;
5、人民大学数据挖掘研究与应用中心。

海量数据——沙漠,隐含的知识——金子,
数据挖掘——从沙漠中挖掘金子的技术。
第三页,课件共29页
二、不同学科对数据挖掘技术的研究与开发

1、理论研究——各种数据挖掘技术的理论基础、理论依据研究,从数学、统计学、人工智能、计算机图形学等不同领域;
2、挖掘技术研究,从统计学、人工智能、机器学****计算机图形学、软件工程等领域;
3、数据管理策略研究,从数据库管理技术等领域;
4、数据挖掘技术的应用研究,其中数据挖掘技术在金融领域的应用是一个重要方面。
第四页,课件共29页
三、几种相对比较成熟的数据挖掘技术

数据挖掘是一门新兴的、正在不断发展中的技术,近年来,几类十分重要、且相对比较成熟的数据挖掘技术是:
1、分类与预测
2、特征化、比较与关联规则挖掘
3、聚类分析
4、序列发现

本课程主要内容:几类数据挖掘技术的基本原理、数据挖掘方法、及这些挖掘技术在金融领域的应用。
第五页,课件共29页
第二章:分类与预测
一、分类与预测的概念
1、分类
已知离散的、有限的几个类,判断或预测样本属于那个类。
* 某人否具有某种疾病
* 上市公司是否会陷入财务困境、是否会被外资并购
* 借款人是否会违约
* 这个客户是否为银行的潜在优质客户、是否会转向其他银行

用y表示类变量,y取离散的几个值,分类就是判断或预测样本的y究竟取什么值
第六页,课件共29页
2、预测

预测是指对连续性变量的取值进行预测,如:
* 某个借款人的违约概率是多少
* 银行资产组合明天在99%置信度下的最大损失(VaR)有 多大
* 如果某开放式基金因面临巨额赎回申请而不得不大量抛售某种证券,这种证券的价格会下跌多少
分类——对离散型变量进行预测
预测——对连续型变量进行预测
第七页,课件共29页
二、分类案例教学——
上市公司财务困境预测模型构建

1、要求:
将因财务状况异常而被特别处理的ST公司界定为财务困境公司、非ST公司界定为财务正常公司,利用上市公司的财务报表数据,建立上市公司财务困境预测模型(提前一年预测,即用第t-2年的数据预测企业在第t年是否会陷入财务困境)。
分类变量y的取值
y=0 如果公司为财务困境公司
y=1 如果公司为财务正常公司
第八页,课件共29页
2、类似案例:
* 外资并购目标公司预测
* 防信用卡诈骗预警系统
* 银行客户关系管理
* 税务稽核
3、数据来源:CSMAR数据库
1990-2004 资产负债表、损益表,
1