1 / 12
文档名称:

建立信用评分模型利用遗传编程-read.doc

格式:doc   大小:304KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

建立信用评分模型利用遗传编程-read.doc

上传人:文库旗舰店 2018/10/14 文件大小:304 KB

下载得到文件列表

建立信用评分模型利用遗传编程-read.doc

相关文档

文档介绍

文档介绍:创新研修作业

陆原鹏
建立信用评分模型利用遗传编程
周崇雄,黄纪正,郑国雄,
信息管理系,国立台湾大学,台北,台湾
管理技术学院,国立交通大学,Ta-Hsuch路, Hsunchu 300 ,新竹1001年,台湾
管理学院,海南大学,桃园县
摘要
信用评分模型已被广泛研究领域的统计,机器学****和人工智能( AI ) 。许多新方法,如人工神经网络(神经网络) ,粗集,或决策树已建议增加信贷的准确性得分模型。由于改善准确性不到百分之一可能转化为重大的节约,更先进的模型应提议大大提高精度的信用评分的模式。本文遗传编程(GP)是用来建立信用评分模型。两个数值例子将聘用这里的错误率比较其他信用评分模型包括人工神经网络,决策树,粗糙集和Logistic回归。在此基础上的结果,我们可以得出结论GP可以提供更好的性能优于其它型号的模型。
2005年埃尔塞维尔有限公司All rights reserved 。
关键词:信用评分;人工神经网络( ANN ) ;决策树;遗传规划(GP) ;粗糙集
1 导言
信用评分模型已广泛应用于金融机构,以确定是否属于贷款客户是良好的申请人集团还是坏的申请人集团。利用信用评分模型的优势可以被描述为从降低信贷成本的分析造福,从而实现更快的信贷决定,确保信贷集合,并尽可能减少风险(李,邱,吕&陈, 2002年;西, 2000年) 。由于改善准确性不到百分之一可能转化为可观的节余(西, 2000年) ,更先进的模型应该提议大大提高精度的信用评分模型在本文。
为了获得满意的信用评分模型,许多方法被提出。大体上,这些
方法可分为以参数统计方法(例如,判别分析和logistic回归) ,非参数统计方法(例如K近邻和决策树)和软计算方法(如人工神经网络( ANN )和粗糙集) 。近年来,人工神经网络是用于信用评分最流行的工具,并已有报告说,其精确度优于传统的统计方法处理关于信用评分的问题,特别是在关于非线性模式(德赛克鲁克, & Overstreet , 1996年, 1997年;Mahlhotra &马罗特拉, 2003年;詹森, 1992年; Piramuthu ,1999年) 。然而,另一方面,人工神经网络已被批评其表现不佳纳入不相关的属性或小的数据集(卡斯蒂略,马绍尔群岛,格林&科登, 2003年;费罗& Cleror , 2002年;纳特,Rajagopalan , & Ryker , 1997年) 。
为了建立一个有效的判别函数,两个问题应该加以考虑。首先,之间的关系属性和类别可线性或非线性。第二,不相关的属性,应该被取消,以便提高精度的分类模型。在本文,GP是采用自动和启发式以确定适当的判别函数和有效属性同时进行。此外,与人工神经网络不同的只适合于大型数据集,GP在小数据集可以做得更好(纳特等人, 1997年) 。
为了有效地获取判别功能,数据集进行预处理的离散。两个现实世界案件将用于以下比较准确率其他分类模式包括logistic回归模型,人工神经网络,决策树和粗糙集。在此基础上,我们可以得出结论,可以提供更好的性能优于其它型号的模型。
其余本文安排如下。第2节介绍了模型的信用评分。离散和遗传规划中提出了第3节。两个实时世界的例子是用来证明拟议,方法在第4节。讨论中提出的第5节和结论是在第6节。
2 信用评分模型
在本节中,我们描述三种流行中使用的模式建立信用评分模型。第一种模式是后勤回归,这是主要用于在统计领域分类问题。第二种模式是人工神经网络,这是以其出色的学****能力,非线性关系的一种制度。第三个模型是粗糙集,这是一种感应基础算法,并已被广泛应用在20世纪90年代以来的分类问题。
。 Logistic回归
Logistic回归模型是一个最流行的统计工具的分类问题. Logistic回归模型,不同于其他统计工具(例如判别分析或普通线性回归) ,可以适合各种分配的职能,如Gamble,Poisson, normal等(新闻威尔逊, 1978年)更适合信用评分的问题。另外,为了提高其准确性和灵活性的几种方法已建议延长传统二进制后勤回归模型,其中包括多分类Logistic回归模型(莱斯蒂, 1990年;奥尔德里奇和纳尔逊, 1984年; DeMaris ,1992年;诺克&伯克, 1980年;廖, 1994年)和后勤回归模型下令类别(本周二, 1980年) 。因此,广义Logistic回归模型是一般形式的二元逻辑回归模型和多分类Logistic回归模型。
让一个P -三维解释变量x0Z(x1,x2,.,
xp)和Y的反应变量与类别1,2,.,r.
那么多分类Logistic回归模型得到的
方程
(1)
是一个(p+1)条载体的回归系数为可变的jth.