论文部分内容阅读
随着我国信贷业务的逐年增加,金融机构和地方经济得以蓬勃发展,但是信用风险也在不断增长,所谓信用风险就是借款人无法按期还本付息而导致银行亏损的可能性。因此我们需要一个科学有效的方法来对个人信用进行评估。本文创新性的将基于正则化下的支持向量机对信用风险进行评估。支持向量机是Vapnik在统计学习理论上提出的一种新的有监督的学习方法,具有全局最优、结构简单、易推广性等优点,但是标准的支持向量机没有特征选择的能力。本文将正则化思想的加入就是让模型具有特征选择的能力。本文的数据来源来是某大型国有银行的小额贷款数据,在具体研究中,首先将正则化思想加入到支持向量机模型中,分别建立了Lasso-SVM和Elastic Net-SVM模型,发现Lasso方法的引入比Elastic Net有更强的特征提取能力和更精确的准确率。其次将正则化支持向量机模型下的评估结果与全变量下的标准支持向量机模型做比较,发现同为支持向量机模型,Lasso-SVM模型筛选出21个变量,该模型的预测准确率不仅没有因为变量个数的减少而大幅下降,反而比核函数为Sigmoid、径向基、多项式时这三种标准支持向量机的准确率要高,可见Lasso-SVM具有有效的特征选择和信用评估能力。最后,本文将该模型与已知预测结果较好的Lasso-Logistic模型进行比较,发现同为具有变量选择能力的模型,Lasso-SVM模型不仅比Lasso-Logistic模型少选了11个变量,而且在预测结果准确率上还高了0.2%。因此本文为信用风险提供了一种新的有效评估方法,而且该方法具有推广价值。