【摘 要】
:
近年来,依托互联网金融科技的进步,“现金贷”这一新的金融产品发展迅猛。现金贷用户的违约预测变得越来越重要,但由于现金贷业务的新兴性及金融数据的敏感性,对于初创现金贷公司或拓展现金贷业务的公司来说,无法获取足够的有标签用户数据进行模型建立,为了解决风控平台的“冷启动”问题,同时拓展传统风控违约预测建模思路,本文结合“迁移学习”方法,利用某公司的信用贷数据和现金贷数据建立迁移学习预测模型,研究迁移学习
论文部分内容阅读
近年来,依托互联网金融科技的进步,“现金贷”这一新的金融产品发展迅猛。现金贷用户的违约预测变得越来越重要,但由于现金贷业务的新兴性及金融数据的敏感性,对于初创现金贷公司或拓展现金贷业务的公司来说,无法获取足够的有标签用户数据进行模型建立,为了解决风控平台的“冷启动”问题,同时拓展传统风控违约预测建模思路,本文结合“迁移学习”方法,利用某公司的信用贷数据和现金贷数据建立迁移学习预测模型,研究迁移学习在风控领域的应用的可行性。本文首先对目前风控领域的研究与应用进行了梳理,介绍了文中算法涉及的相关理论基础;之后针对实证数据的特点进行了简单的介绍,并进行预处理和特征工程,利用现金贷数据结合Logistic Regression算法和XGBoost算法建立传统模型并分析评估了模型效果;然后利用信用贷数据作为辅助数据,现金贷数据作为目标数据,分别使用Tradaboost迁移学习算法及基于XGBoost和K-means的迁移学习框架建立了预测模型并与传统模型进行对比,结果表明迁移学习算法可以在一定程度上提高模型预测能力,弥补样本不足情况下的模型预测能力较差的问题,同时,本文提出的基于XGBoost分类器的源域样本筛选方法效果较为显著。最后,本文结合模型效果及具体业务特点,提出了迁移学习模型在现金贷业务中应用的方式和方法。通过深入分析模型效果和具体业务,本文认为迁移学习方法针对无大量用户样本数据的冷启动情况有一定的帮助,迁移学习方法在现金贷风控平台的建设中具有一定的应用价值。
其他文献
本文探讨了中职学校班级管理中做好后进生转化工作的基本要求和方法策略.认为只有根据后进生的具体情况“量体裁衣”,采取适宜的方法措施,才能达到转化后进生的目的.
通过原核表达和镍柱亲和层析获得纯度达95%以上的重组旋毛虫蛋白谷胱甘肽S-转移酶(rTs-GST),相对分子质量26 000。分离小鼠骨髓源树突状细胞(BMDC),体外培养至第7天,加入rTs-
荷载试验是一种重要的检测手段,可以为决策者对桥梁的承载能力做出科学地评估,提供有利、直观的依据,可以为新的结构、新的设计理论和新的施工工艺的发展与应用积累实践资料。公
用前线轨道理论、催化理论对乙烯催化加氢反应机理进行了分析,可以得出:在此反应中,有下列反应机理存在:在一些教材和文献中,对乙烯催化加氢反应机理一般用下列方法解释[1](如图1):但据催
在当前日益开放的出版环境中,创意出版既是传统出版发展的内在要求,也是其应对危机与挑战的必然方式。大力提倡创意出版,将创意行为融入出版全过程,提升出版竞争力,是实现传
本文通过大田试验和室内分析方法研究了潮土上两个超高产小麦品种吸钾能力、钾利用效率,钾与小麦的形态特点、生理特性和品质性状的关系,初步研究结果表明: 1、两个超高产小
本文主要是关于公司治理法律制度完善中,公司治理法律制度的本土化研究。从内容上看主要是就公司治理制度的本土化进行了分析,具体分为三部分:第一部分是公司治理制度演变中的本
白酒是民族工业与传统的代表之一,有着5000多年的悠久历史,是传统文化的象征。但因消费观念和消费潮流的变化,近年来白酒的整体市场容量逐年萎缩,前景黯淡,白酒也因此被定义为“夕
随着企业规模的扩大和市场竞争的更加激烈,企业益发认识到人力资源管理的重要性及提升企业自身人力资源管理水平的迫切性。而人力资源管理水平的提升不仅需要高素质的管理人员
<正>目的骨质疏松与衰老及许多代谢性疾病密切相关,被视为全球最严重的公共健康问题之一。糖皮质激素(Glucocorticoid,GC)被广泛用于抗炎、抗过敏、抗中毒、抗休克的治疗,但