基于不平衡样本网络借贷个人信用评价模型

来源 :燕山大学 | 被引量 : 0次 | 上传用户:ruinx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络借贷行业借助日新月异的互联网技术开辟了大热的互联网金融行业,但是,就目前来说,虽然行业发展非常迅猛,但行业内各种问题频频爆出,其中借款人违约风险较高的问题对网络借贷的正常交易产生了严重的不良影响。首先,为了研究网络借贷中借款人违约的问题,论文利用Python软件,爬取某互联网金融公司借款人的真实交易记录数据,选取与借款人信用评级密切相关的观测指标,建立各输入变量指标与信用评级交叉分布表,并对各个指标的所有特征值进行量化打分,构建网络借贷个人信用评价量化打分表。基于量化打分表,将爬取的原始数据进行量化打分并利用EM算法对数据缺失值进行插值处理。其次,当指标体系构建完成后,鉴于爬取数据存在正类样本过多、负类样本过少的样本不平衡问题,提出了改进的SMOTE算法。分别使用改进前后的SMOTE算法对不平衡数据集进行过抽样处理,并采用朴素贝叶斯、神经网络、K近邻、支持向量机及决策树五种分类器对SMOTE算法改进前后的数据集进行分类,选择几何均数(G-mean)和曲线下面积(AUC)两个评价指标对分类效果进行检验。通过对比研究,发现改进的SMOTE算法分类效果提升更加明显,说明改进后的SMOTE算法生成的少数类样本更加科学合理,并且与改进后的SMOTE算法配合效果最好的分类器为决策树模型。最后,论文基于利用改进的SMOTE算法构造的平衡数据集建立网络借贷个人信用评价模型,首先基于CART算法,建立预剪枝、后剪枝的单棵决策树模型,然后结合网络借贷的实际情况,构造损失矩阵,建立基于损失函数优化的C5.0决策树模型。考虑到单棵决策树可能存在的不稳定性,论文基于随机森林算法建立组合决策树模型进行优化改进,研究表明,集成算法提升了模型预测的准确率与稳定性。
其他文献
<正>依法执政标志着中国的治国方略开始逐步纳入行政轨道。坚持依法执政,体现在政府工作中,就是要严格依法行政,而乡镇政府作为我国行政体系中最基层的行政单位,是依法管理、依法
目的了解肝硬化食管胃底静脉曲张的某些临床特征和内镜下表现以及目前各种防治措施在临床上应用情况,为临床诊治提供指导。方法回顾性收集过去2年经胃镜确诊且资料较完整的肝
从电动刀架的换刀原理和控制原理分析阐述了电动刀架在使用中常出现的故障,并分析其原因对故障进行排除总结了排除故障的方法。
加强草坪抗旱性及水分利用效率的理论和应用研究,培育节水草坪新品种,是解决草坪生产和应用所面临水资源短缺的关键。根据近年来该领域研究现状,对国内外草坪草的抗旱形态、
<正> 过敏性鼻炎发病率很高,我国东南沿海更是高发区。据笔者的临床观察,每天约占就诊病人的10%~20%。笔者筛选经过多种方法治疗不愈的顽固性过敏性鼻炎35例,采用筛前神经切断
随着“一带一路”战略的推进,海外中资企业和中国公民面临越来越严重的人身和财产安全挑战。随着海外安全治理市场化研究的深入,扶持中资安保公司走出去为境外中资企业和中国
被告人在未能补办遗失居民身份证的情况下,雇佣他人以本人的真实身份资料伪造居民身份证,供自己在日常生活中使用的行为,虽然违反身份证管理的法律规定,但情节显著轻微,危害
本文就树立现代化理财观念建立适应企业改制需要的企业内部财务管理机制以及强化商品经营管理 ,论述了市场经济条件下 ,提高企业财务管理水平 ,以适应新形势的要求。
我国商业银行信息化建设在取得巨大成就的同时也存在若干阻碍因素。信息化建设战略结构模型的建立可以给我国银行业信息化建设提供全方位的战略指导,从而提高银行信息化运行
洗脚时顺便摸一下足背动脉搏动情况就可以了解下肢动脉是否硬化及闭塞。足背动脉位置表浅,位于足背部大拇趾和第二趾(第1、2跖骨之间的连线)中间,与内、外踝经足背连线的中点相
报纸