论文部分内容阅读
目前,我国的互联网金融行业正以迅猛的发展得到各界人士的高度关注。如何全面、高效、准确地帮助P2P企业评估申请客户的信用风险情况,以降低企业损失的同时,开展个性化的授信额度等一系列金融服务,是多数银行、小额信贷公司和P2P等新兴互联网金融公司风险控制的核心环节。为了降低由于客户的筛选不利而导致的不良率和损失率,各类金融机构在客户进件的风险评估环节中,都过于倚重央行征信系统。但是,央行等机构收录的人数,有信贷记录的不足40%。因此,探索和开发信用评分模型中所用到的技术与策略,将有助于降低P2P企业的风险。首先,本文分析了国内外相关文献资料,发现大多数学者的关注点都在模型算法的选择上,即通过神经网络,支持向量机、决策树等机器学习算法的比较来择优选择某一算法来提高模型的预测能力。那么,在保证业务逻辑和模型广泛应用的基础上,除了选择合适的模型算法之外,对某一算法的优化就成为本文研究的重点。因此,本文研究目的是:在信用评分卡模型具有强解释性的基础上,满足模型较高的稳定性与较强的预测能力。鉴于机器学习算法的“黑箱”操作,本文选择使用传统的统计学方法,即逻辑回归模型来建立信用评分卡模型。并结合实例对模型建立的中间环节进行优化对比,寻找最优的模型来应用。然后,文章介绍了模型建立过程中使用到的关键技术,包括样本选择、客户分类、变量筛选、变量分组、WOE变换(Weight of Evidence,证据权重变换,简称WOE)等,论文的着重点在于建立信用评分卡过程中的变量分组阶段。本文通过分析变量分组的优缺点来说明变量分组对模型建立的重要性,并引用了三种变量分组方法,即“最优化变量分组法”、“卡方统计量分组法”和“有序聚类分组法”这三种方法都是目前适用于信用评分卡模型的关键技术。最后,本文选取了A企业的实际案例作为研究对象,来建立一个适合该企业的申请信用评分卡模型,以此作为客户进件的审核关卡来判断客户的优劣。具体过程是:首先通过客户的基础资料背景,及其他第三方数据等各方面信息来给客户打分建模,通过该模型来判断不同分数对应的不同违约情况与此时的客户通过率,在企业给定的通过率下,决定评分卡模型的阈值。结论发现:使用“最优化变量分组法”得到的模型最优,此时模型较其他两种方法建立的模型更稳定。另外,本文在实际业务的基础上,进行格外探索,将在模型阈值附近客户(简称“灰色客户”)进行细分,根据分数给予不用的授信额度,以提高企业收益。本文建立的信用评分卡较原本的人工审核而言,既高效又易于解释。其研究成果对客户筛选、企业风险降低有重要的实际意义。