文档介绍:摘要以计算机与网络技术的发展为代表的信息技术的飞速发展,为行业信息化的建设奠定了坚实的基础,同时促进了各行业的信息化进程。银行业是中国最开展的工作,这也成为了目前银行业最为关注的热点。年卵胄姓餍畔统的开通运行为银行的贷款决策提供了一定的支持,但其系统功能仅限于业务品的竞争上优势不大。如何管理客户关系,以及挖掘出隐藏在客户信息背后的业务规律,成为银行业战略决策的一个重要方面。数据挖掘是一种较新的决策支持技术,具有从海量数据中提取人们未知信息的能力,近年来受到了银行业的持续关注。关联规则是数据挖掘最活跃的研究分支,也是最成熟的数据挖掘技术,在行为分析方面具有独特的优势。基于以上几方面的认识,本文以个人征信数据为平台,对征信数据的关联规则挖掘方法作了较为深入的分析和研究,给出了一类基于属性约束和规则后件约束的挖掘算法—和规则生成算法荽松杓屏艘桓鍪涤玫耐诰蛳低常迪了对征信数据的有效应用挖掘,以期为银行的信用营销管理决策提供理论和实践方面的依据。具体研究内容如下:深入研究关联规则挖掘理论,对关联规则挖掘的算法进行了深入的分对征信数据进行深入的分析,深入研究了征信数据的基本构成,并就每一构成部分进行详细的功能分析;并对数据的预处理方法进行了分析,为下步的挖掘做初步探索。研究征信数据的整个挖掘过程,针对特定的挖掘任务和挖掘目标,给规则后件约束集成到规则生成算法中,给出了基于规则后件约束的规则生成算法⑼ü导实耐诰蛳低辰辛搜橹ぁ根据挖掘的关联规则进行后处理,并运用信息增益方法,建立了基于早开始信息化建设,也是最早完成信息化建设的行业之一,具备了完备的数据基础。然而,在对已经掌握的海量数据的分析研究与应用方面,还有许多可以查询,对征信系统及其数据的利用率较低。银行产品的同质性较为严重,在产析,并就关联规则的优化问题展开深入的讨论。出了基于属性约束和规则后件约束的挖掘算法—,并把规则的相关性分析和
信息增益的关联规则决策矩阵模型,并就模型的应用和决策支持展开了较为深入的研究与探讨。关键词:数据挖掘;关联规则;征信数据;关联矩阵;信息增益摘要
,,..;—瓵,瓵猂痓琣,.,甈瓾...,,甊’瓸,.
琣甊’,,篸瓵玆痓甌;;;.;,籱,.;;;
舻日学位论文作者签名:谚学位论文版权使用授权书本人完全了解北京机械工业学院关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。
硕士学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。日
第一章绪论研究意义数据挖掘是一种新的决策支持技术,近十年来得到了迅速的发展和应用。信息化技术的广泛使用、网络的普及已经使商务、科学、行政事务的信息化进程加快,产生和收集数据的能力大大加强。专家预计,现在我们每个月的信息量就要翻一番,可对这些信息的利用率只有ィィ行┬幸祷乖对兜陀谡个比例。怎样从大量的数据中挖掘出有用的、有效的信息,已成为目前迫切的现实需求。我国银行是最早完成信息化建设的行业之一,汇集了丰富的数据,但缺乏从大量数据中发掘有用信息的工具。外资银行的进入,使银行面临着更加激烈的竞争。现有的客户资源是中资银行对抗外资银行的最大资本。如何通过挖掘技术从海量的数据中发掘业务和客户信息背后的业务规律,从而做出合理的决策,已成为银行赢得竞争优势的关键。近几年,消费信贷的蓬勃发展积累了大量的信用数据。目前,央行征信系统收录的个人信用数据已达亿人,其中有信贷记录的约为万人。丰富的数据隐藏着丰富的信息,如何从海量的征信数据中提取信息为决策服务,成为目前研究的一个重要的课题。传统的基于定性分析和数理统计分析的方法在实际的决策应用中并不总是令人满意。定性分析虽然能为决策提供方向性的指导,但无法提供精确的决策信息,在面对复杂的环境和多重因素的交叉作用时,定性分析显得无能为力。传统的基于数理统计的分析方法建立的模型假设条件太多,实际应用往往难于奏效。面对海量的数据,如何从其中挖掘出高附加值的信息为金融机构及监管部门提供科学化的管理决策支持技术已成为我国信用管理研究领域迫切需要解决的问题。关联规则挖掘是用得最广泛,最成熟的数据挖