论文部分内容阅读
国家助学贷款是由国家财政贴息、四大国有商业银行竞标承办、适用于高等学校中经济确实困难的全日制研究生、本科生和专科生的无担保信用贷款。因此国家助学贷款实质上是具有明显政策性特征但本质上属于商业性贷款的个人教育消费信贷。从国家助学贷款近期实施情况来看,出现了贷款发放率不高、商业银行惜贷以及部分贫困学生无法获得助学贷款等现象,国家助学贷款已成为一个社会普遍关注的问题。因此,本文试图通过将判别分析、Logistic回归等统计分析方法应用于助学贷款信用风险管理之中,借鉴目前银行体系个人信用卡业务中普遍使用的信用风险管理方法,在进行多方面的改进与创新的基础上,尝试建立一个适用于商业银行国家助学贷款业务的、对高校学生信用风险进行有效管理的个人信用评分模型,以此来有效的降低目前银行承担的较大的助学贷款违约风险。 首先,在目前竞标承办国家助学贷款业务的中国银行总行的支持下,本文使用了所收集到的全国范围内共九所高校于2004年申请中国银行助学贷款服务的学生数据作为模型开发数据集。对于高校的选取基本覆盖了我国东北、华北、华南、西南与西北等高校密集区域,同时本文也注意了重点高校与普通类高校、综合类院校与工科院校的结合。于九所高校所收集到的学生样本共计3748人,其中正常还款3373人,违约375人。随后,按照通行的建立个人信用评分模型时使用的取样方法,本文从正常学生中随机抽取了2700个样本,与同样从违约学生中随机抽取的300个违约样本一起构建模型训练样本集。同时,使用剩余的673个正常学生样本与的75个违约学生样本构建模型检验样本集。 建模的训练样本集与检验样本集确定后,将对样本数据中各样本特征变量进行量化处理,即将各特征变量按信用表现相似的原则进行分组,并使用虚拟变量表示。在进行特征变量的虚拟化过程中,本文以求虚拟化过程能够最真实、最有效的将样本集中数据的特征表现出来。对于定性变量,如学生毕业院校将根据是否同时进入国家教育部“985”与“211”工程重点院校名单进行判断。而对于连续型变量,如将学生年龄大小这种连续型定量变量虚拟化,需要使用“信息统计量”将年龄变量先进行分段后,再用虚拟变量表示。 随后,由于样本中的共计16个特征变量中,可能有某个或某几个变量对建模并没有太大贡献。为了得到对建模最合适的特征变量,同时消除特征变量间的多重共线性,此处使用判别分析中的逐步判别法,利用得出的判别函数得到对建模最重要的特征变量。 至此,建模的样本已完成了所有需要的预处理工作。随后本文使用了Logistic回归中的逐步回归法建立助学贷款学生的违约率预测模型。在得到了预想的模型之后,对模型进行了各类显著性检验。包括模型回归显著性指标-2 LogLikelihood、Cox&Snell R Square与Nagelkerke R Square,以及Kolmogorov-Smirnov检验和计算ROC曲线及Gini系数的检验。检验结果中模型所表现出来的良好效果,为下一步得到最终的国家助学贷款个人信用评分模型奠定了坚实的基础。 在前面所得到的违约率预测模型的基础上,本文使用Scaling技术,对非线性的违约率预测模型进行缩放、平移等操作,最终得到了助学贷款个人信用评分模型。同时,利用Scaling之后的信用评分模型的线性特征,设计了可以直接用于实际助学贷款授信业务的个人信用评分卡。 最后,本文使用预留的检验样本集对模型效果进行最终的检验。在对模型检验结果进行讨论的基础上,也提出了对模型进行进一步改进的两条思路:第一是提出了商业银行根据实际违约率控制目标来选择正常与违约学生判别临界分数的策略曲线;第二是设定评分的灰色区间,即对得分位于此区间的样本模型并不给出明确判断,需银行贷款发放人员视具体情况,并根据工作经验进行判断后做出信贷决策。 本文最大的创新之处在于,本文所提出的个人信用评分模型建立了信用评分与预测违约率的一一对应关系。这将使信用评分分数段有相应的违约率区间与之对应,使信用评分分值对学生信用状况具有更强的解释性,同时,也将为授信银行根据自身的贷款违约率控制目标来选择相应的信用评分判别临界值提供依据。 因此,本文建立的国家助学贷款个人信用评分模型具有简单实用、解释性强以及易于操作的优点,有助于防范助贷违约风险,切实提高国家助学贷款信用风险管理水平。