论文部分内容阅读
近年来在零售业中,新客户资源逐渐减少,休眠客户唤醒成为零售商家稳定资金流入和防止客户流失的重要策略,如何能最大程度地唤醒休眠客户成为商家们的普遍问题。随着线上交易的繁荣发展,各个商家都累积了大量的客户交易数据,基于数据库的客户营销策略愈发凸显其高效、准确的优点。本文就美库尔公司提供的某化妆品公司共15万条交易数据,通过数据挖掘技术识别休眠客户中的响应客户,并在固定唤醒成本的情况下制定最优邮件发放策略。针对数据存在的不均衡特点,分别建立logistic回归、欠采样下支持向量机的bagging集成方法、梯度提升机(GBM)和孤立森林(Isolation Forest)四种模型识别响应客户;在四种模型下,对5万目标休眠客户分组,通过模型预测的组内人均消费和唤醒邮件花费计算客户在各个模型下的得分。以"二八定律"为原则,在10000元的唤醒成本上限下,向得分靠前的客户发送邮件,提升在每个客户上的单位收益。结果表明,四种方法都有助于在减少成本的情况下,寻找更高价值客户。相比logistic回归,后三种机器学习方法的模型拟合效果更好,有着更高相互客户识别能力;而logistic回归的模型拟合曲线更平滑,对人均收益的提升效果则更高。