文档介绍:硕士学位论文
基于 SVM 的满意特征选择方法在个人信用
评估中的应用
贾君花
2009 年 6 月
国内图书分类号:O234 学校代码:10213
国际图书分类号: 密级: 公开
理学硕士学位论文
基于 SVM 的满意特征选择方法在个人信用
评估中的应用
硕 士 研 究 生 : 贾君花
导 师: 张池平教授
申 请 学 位: 理学硕士
学 科、专 业: 计算数学
所 在 单 位: 数学系
答 辩 日 期: 2009 年 6 月
授予学位单位: 哈尔滨工业大学
Classified Index: O234
:
Dissertation for the Master Degree in Science
APPLICATION OF SATISFACTORY FEATURE
SELECTION METHOD BASED ON SVM IN
INDIVIDUAL CREDIT ASSESSMENT
Candidate: Jia Junhua
Supervisor: Prof. Zhang Chiping
Academic Degree Applied for: Master of Science
Speciality: Computational Mathematics
Affiliation: Department of Mathematics
Date of Defence: June, 2009
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学理学硕士学位论文
摘 要
贷款业务是银行极为重要的资产业务,因此对于申请贷款的人进行信用评估
就显得十分重要。
对于信用评估机构和评估人员来说,信用评估指标是他们从事信用评估工作
的基础和依据。然而在众多的信用评估体系中,人们只是着重于评估模型的建立,
而对信用评估的基础——评估指标体系的选择却显的过于简单。他们大多数依从
财务专家建议,或只是进行简单的筛选,并没有在此领域进行深入的探讨。
在统计学****理论中,结构风险最小化的支持向量机(Support Vector Machine,
简称 SVM) 算法克服了传统信用评估模型中的过拟合和局部最优的缺点,并且
通过在模型中采用核函数,有效地解决了线性不可分问题,是一种有效的模式分
类方法, 具有速度快, 准确率高的特点。然而在处理大规模和高维数问题时, 依
然要花费较多的时间,因此如果在此之前能进行有效的特征选择、消除冗余, 将
在一定程度上提高 SVM 的分类性能。
本文将满意优化思想引入到了信用指标选取这一特征选择问题中,以遗传算
法作为特征子集搜索策略,在综合考虑了选出的特征子集的维数、特征提取复杂
度和各个信用等级上的预测能力的基础上,并结合个人信用评估中实际问题的需
要,设计了独特的特征集满意度函数来对所选取的特征子集进行满意程度的评
价。文中采用 SVM5 fold CV 方法评估特征子集的预测性能,通过与基于 SVM
的其它三种 Wr