论文部分内容阅读
目前我国二手车市场的发展不完善,仍然存在很多问题。尤其是评估二手车价值,机构和个人对二手车的评估价格各有不同,其差异性给二手车的交易造成较大困难。随着时代的发展,二手车的交易规模在不断增加,针对二手车交易过程中交易价格过高或过低以及中介平台肆意标价的不良行为,需要从二手车本身的数据指标出发,对二手车进行精准估价,才能保护消费者的合法权益,降低消费者的价格损失,促进二手车市场的平稳发展。对二手车的价格进行评估预测有助于规范二手车销售平台行业准则,解决二手车价格评估的合理性问题,让卖家卖出满意的价格,买家买到物有所值的商品。本文对人人二手车网站的二手车进行价格评估,利用网络爬虫技术搜集数据,接着对数据进行预处理,对数据进行转换、填补缺失值,对数据指标进行相关性分析,对指标特征和二手车的价格数据进行描述性分析,得出各个品牌车辆的参数概况,分析二手车价格分布情况。然后将所有原始数据利用支持向量机SVM对二手车价格进行预测,在模型效果调优的基础上对数据指标进行优化,运用特征工程,分别利用PCA主成分分析、随机森林和梯度提升树GBDT进行特征选择,将选择出的信息表达程度较多,重要性较大的特征指标与SVM模型结合进行预测,从而优化模型预测效果,使其对二手车价格评估更加准确。研究结果表明数据指标与二手车的价格均有关系,不同品牌的的二手车之间价格和配置存在差异。对于经过特征优化的三种预测模型,都比传统的支持向量机预测效果要好,GBDT特征优化结合的SVM模型对二手车价格预测效果最好,预测值与真实值误差最小,随机森林特征优化SVM模型的预测结果最稳定。对于中端车的价格预测,GBDT特征优化结合的SVM模型预测效果最好,差值在0-3左右,但是对于高端车的预测,GBDT特征优化结合的SVM模型预测结果与真实值有一定的偏差,因此建议消费者在高端二手车的购买时需要查看其他配置信息,以做出更加合理的判断。最后从国家政策、二手车交易平台、消费者三个角度提出建议。