基于XGBoost和CatBoost相结合的消费券精准投放研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:yxx1314521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
O2O即Online to Offline,是一种线下商户与互联网相互结合的商业模式。近年来,随着移动端网络消费的兴起,O2O消费得到了各大商业平台的广泛关注,其中蕴藏着巨大的商业价值。消费券投放是O2O的一种重要营销策略,但随机投放会对大多数用户造成干扰,同时也会增加商家的营销成本。精准投放是提高消费券核销率的重要技术,它可以让商家直接面向具有一定消费偏好的用户,使其得到真正的实惠,在降低商家营销成本的同时促进商家的营业额,实现商家、用户共赢。O2O行业的特性使其天然与数以亿计的消费者相关联,记录着海量的用户历史流水信息。本文通过对这些真实的用户历史流水记录进行挖掘,并构建相应的特征群训练得到用户的消费券核销预测模型,以此预测用户未来是否会使用消费券,从而为消费券的精准投放提供决策依据,主要的研究工作可以分为以下四个方面:(1)首先从消费券、商户以及用户三个方面进行数据探索并在此基础上构建相应的特征群,用以表征用户的消费行为习惯,商户和消费券本身的信息属性,并通过方差选择和极端梯度提升树算法XGBoost对原始特征进行特征筛选,以去除相应的冗余特征,完成数据集的构建;(2)为了增强特征的表达能力,本文基于XGBoost对原始特征群进行特征变换,随后将变换得到的新特征与原始特征进行合并,从而构建得到新的训练数据,并以此训练XGBoost得到基于XGBoost特征变换的消费券核销预测模型,实验表明,相较于原始特征集,通过特征变换能够进一步提升模型的预测效果;(3)传统的梯度提升算法普遍都会在训练过程中产生有偏的梯度估计,使得最终训练得到的模型产生预测偏移,影响其泛化能力。为此,本文引入新型的梯度提升算法CatBoost,它基于Ordered Boosting的方式进行训练,得到训练所需的无偏梯度估计以减缓预测偏移,从而增强模型的泛化能力。实验表明,基于CatBoost的消费券核销预测模型相较于传统梯度提升算法有更好的模型性能;(4)最后将上述(2)、(3)中的单一模型进行加权融合,从而得到最终的基于XGBoost和CatBoost相结合的消费券核销预测模型,对用户未来是否会使用消费券进行预测。实验表明,相较于单一模型,融合模型具有更好的预测效果,从而能为消费券的精准投放提供较为可靠的决策依据。
其他文献
真实性是新闻的生命。所谓真实,就是跟客观事物相符合。但是,客观事物是纷繁复杂的,事物本身的多侧面性、作者的主观倾向性和选材的随意性,可以轻易地对人和事从某个正反视角
目的:为制定全国药品集中采购政策提供参考。方法:通过对药品集中采购5个阶段的回顾,分析药品集中采购政策目标、组织运行方式、集中采购适用的范围以及集中采购的方式和规则
采用生物信息学方法对GenBank,SwissProt中的拟南芥、大豆、甘蓝型油菜、小麦等物种的乙酰辅酶A羧化酶核苷酸和氨基酸序列进行了比对分析,进而对其组成成分、理化性质、疏水
目的:分析结直肠癌确诊时合并肝转移的临床和病理危险因素,为结直肠癌肝转移的早期诊断和进一步治疗提供参考。方法:对2006年1月—2008年6月宁波市第一医院普外科收治的247例
以生长于河西走廊地区不同生境的芦苇为材料,通过扫描电镜和光学显微镜的观察,对其叶片表皮微形态及横切面解剖结构进行了分析.结果表明:不同生境芦苇表皮微形态变化中,流动
<正> 前不久,Beyond乐队成员叶世荣来到郑州宣传他的背后专辑《叶子红了》。《叶子红了》是叶世荣在Beyond乐队宣告解散之后,推出的首张个人专辑,也是个人发展以来的第二张专
<正>陶行知"生活教育"理论是一种建立在生活基础之上的充满生机、充满活力的教育。陶行知"生活教育"理论对幼儿园的科学教育有着重要的启示。一、陶行知"生活教育"理论对幼儿
<正>双排键电子琴是现代电子科技与音乐艺术完美结合的产物,具有音色优美、功能丰富、表现力强、兼容性强等特点,便利于演奏者体现音乐的音响美、意象美、意蕴美、意境美。正
<正>【智库观察】大数据已对社会结构、社会观念等方面产生了全方位冲击和深层次震荡,对政府治理能力提升带来新机遇和新挑战。在大数据时代,政府要充分利用大数据,通过数据
红外光谱法(IR)和拉曼光谱法(Raman)等快速检验技术可对气体爆炸现场中的爆炸遗留物和残留物进行快速检验和初步定性。本文结合一起可燃气体爆炸实际案例,利用手持式红外/拉曼光