论文部分内容阅读
随着个人消费信贷产业的蓬勃发展,许多金融机构在追求利益的同时也伴随着巨大的信用风险,所以如何避免这些信用风险成为了银行和信贷机构面临的急需解决的问题。个人信用评分模型是利用统计分析方法和数据挖掘技术对个人基本信息数据进行分析,将当前的个人信息数据转化为能够表征将来某种信用风险的数值。早期的个人信用评分技术是基于基础的统计学方法进行研究,但是随着机器学习的发展,越来越多的学者研究较为复杂的机器学习方法以及统计学方法与机器学习方法相结合的方法,但是如何评价众多模型还没有一致的结论。国外发达国家虽然已经形成了较为完善的个人信用评价系统,但是在中国不健全的个人征信体系下并不适用,因此构建一个符合中国特色的个人征信体系十分必要。本文以中国某金融机构的实际数据为例,详细介绍了个人消费信用评分模型的构建过程与评价。首先根据数据的特点,构建了能够充分体现数据特征的“RFMC”评价指标体系,对数据进行预处理之后,分别建立了三种不同类型的单一模型:反映专家知识和经验的主观评价方法—模糊层次分析法,反映不同指标数据之间差异的客观评价方法—灰色综合评价,以及体现数据规律的Logistic回归模型,并使用粒子群优化算法将上述三种单一模型进行组合优化,最后在总结论文的基础上提出相关建议,并对以后的研究方向进行了展望。通过对四种个人消费信用评分模型的第二类错误率、AUC值和KS值比较后发现:每种模型都有一定的区分能力。单一模型中,性能最优的是Logistic回归模型,其第二类错误率最小为29%,AUC值和KS值也是三种单一模型中最高的,分别为0.73和0.36。模糊层次分析法的第二类错误率为35%,AUC值为0.63,KS值为0.21,是三种单一模型中性能最差的模型;经过组合优化后的模型,性能有了一定的提升,组合模型将第二类错误率降低到了 25%,比最优单一模型—Logistic回归模型的第二类错误率降低了 4%,AUC值也优化到了 0.79,虽然优化结果并不明显,但是在信贷市场,即使是有微小的改善,也代表着显著地竞争优势。与已有研究相比,本文从个人消费信用评价指标体系的构建和个人消费信用评分模型的选择上进行了创新:(1)个人消费信用评分指标体系的构建。本文根据已有数据的特点—消费型数据,引入了客户管理分析模型中用于衡量客户重要程度的“RFM”模型,并加入了能够评价客户消费波动性的指标变异系数—“C”,形成了“RFMC”的评价指标体系,与单纯根据变量之间关系构建的指标体系相比,“RFMC”指标体系更能够充分展现了消费数据所包含的信息。(2)个人消费信用评分模型的选择。本文选择了三种不同类型的单一评价模型:模糊层次分析法、灰色综合评价以及Logistic回归模型,并利用粒子群优化算法构建了一种基于上述三种主客观评价模型的异质集成模型,对四种模型的第二类错误率、AUC值以及KS值比较之后发现,组合模型的性能要优于单一模型。