论文部分内容阅读
P2P借贷作为互联网金融的新兴形式,已经成为个人理财的一个重要选择,但是P2P借贷普遍存在违约问题。针对这一问题,现有的风险评估模型往往只利用借贷的标的信息和借贷人本身信息来降低违约风险。然而不同的借款人之间并不是独立的,因此我们引入了社交的概念(Social),并使用增强学习模型中一类较好的分类器GBDT模型(Gradient Boosting Decision Tree),提出了社交数据驱动的P2P借贷风险评估模型(GBDT-SOC)。首先,我们通过对P2P借贷数据的统计,发现社交因素与借贷人违约之间的潜在关系;分别对借贷人基于朋友信息的点对点联系和基于群组信息的群体间联系建立了相应的社交影响力模型。然后我们进行特征选取和特征的重新构建,并在这些特征上使用GBDT模型进行建模,并将我们建立的社交影响力模型与GBDT模型结合,构建本文的GBDT-SOC模型,对模型进行线性回归。最后利用梯度下降法训练参数,得到对借贷的风险评估结果。本文在P2P借贷平台Prosper的数据集上进行结果分析和对比实验。实验结果表明,相较于传统的P2P借贷风险评估模型,本文在Prosper数据集模型显著地提高了风险预测的准确度。