论文部分内容阅读
随着电子商务和互联网科技的飞速发展,很多实体行业正在逐渐地开拓线上市场,其中网上拍卖迅速在我国兴起,它不仅彻底改变了现代人类社会的各种传统贸易模式,也从很大程度上减少了参加投标与组织拍卖的成本。在享受网上拍卖所带来便捷的同时,网上拍卖的欺诈问题也随之出现。拍卖欺诈是最主要的网络犯罪之一,因此对拍卖欺诈行为的识别显得尤为重要,否则很可能导致市场失衡,进而对拍卖行业造成负面影响。托投标是最具隐蔽性的在线拍卖欺诈形式之一。本文通过几种机器学习模型识别网上拍卖过程中的卖家托投标行为。鉴于实验数据存在严重类别不平衡现象,在建立建模之前,应先对数据进行平衡处理,这里采用的是SMOTE过采样方法。为了验证训练数据对分类器的影响,对SMOTE过采样处理前后的数据各建立五种分类模型,分别是GBDT、Ada Boost、随机森林、逻辑回归和决策树模型,再使用交叉验证对模型进行检验。结果表明,基于过采样方法的模型相比于未进行数据平衡处理的模型取得了更好的分类效果,其中基于过采样方法的GBDT模型更适合本文数据,此模型的预测效果更好。