基于深度学习的广告点击率预估研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:xtzzll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的飞速发展使得在线广告的重要性越来越高。作为广告系统中的核心步骤,广告点击率预估是指在给定的场景下,预测用户对展示广告的点击概率。有效的广告点击率预估模型能够为公司带来巨大的收益。如何建立准确、高效、稳定的点击率预估模型是学术界和工业界研究的热点。基于传统机器学习的点击率预估方法在工业界得到广泛的应用,但难以构造隐含的、高阶的组合特征,需要大量的人工特征工程。而目前基于深度学习的点击率预估算法利用因子分解机、多层感知机等结构分别进行浅层和深层的特征交叉,提取高阶组合特征,建立起端到端的点击率预估模型。因此本文对基于深度学习的点击率预估模型进行研究,主要的工作内容分为以下两个方面:(1)针对目前点击率模型进行元素级的特征交叉,只获取了局部的特征组合信息没有明确特征之间的联系这一问题,本文提出一种基于向量级特征交叉的广告点击率预估并行模型(GFICNN)。GFICNN深层结构使用多层宽度为1的卷积神经网络进行全局的向量级特征交叉,得到深层高阶的组合特征。浅层结构为因子分解机模型。然后通过全局平均池化层将深层、浅层模型获取的组合特征融合,得到广告日志最终的特征表示,进而进行点击率预估。本文对Criteo公开日志进行处理,作为实验数据集进行横向对比实验,实验结果表明GFICNN模型相比xDeepFM模型在AUC上提高了 1.1%,Log Loss上降低了 1.3%,训练时间缩短了 11%。并进一步在多个经典点击率模型上研究GAP层的作用,发现使用GAP层能给并行点击率预估模型带来一定的提升。(2)针对在广告冷启动问题研究中新广告数据量不够无法学习有效的嵌入表示的情况,本文提出了基于属性交互的点击率预估模型ICN以及WICN,核心思路是利用曝光度足够的特征属性丰富新广告的嵌入表示。ICN模型总体上分为三部分:嵌入层、属性交互层和特征交叉层。WICN以ICN为基础,在属性交互层添加了权重信息。模型通过属性交互层学习用户与广告属性得到交互特征,然后利用交互特征丰富新广告的嵌入表示,最后通过特征交叉层学习提取高阶的特征组合,进行点击率预测。本文利用AVAZU提供的日志数据构建数据集,进行对比实验,分别在新广告占比为10%、20%、30%的测试集上验证新模型,ICN模型和WICN在构建的三个数据集上AUC均有一定提高,说明模型所提取的属性交互特征能够学习到更精确有效的新广告的嵌入表示。
其他文献
随着社会经济的日益进步和人们生活水平的不断提高,消费者对超市便利、生鲜果蔬、鲜花绿植等品类的即时性配送有很大的需求,在整个零售消费市场,存在巨大的市场空缺以及为用户提供更加全面且完善的服务,亟需新的即时零售模式以及配套的网络技术,主动抢占市场,填补市场空缺,推动经济发展。故而,美团点评发布了“美团闪购”品牌。美团闪购是美团点评旗下的一项零售业务,闪购致力于为消费者提供丰富的零售商品类别选择和便捷的
2019年,在新冠疫情的影响下,社区成为了零售市场一片尚待开发的蓝海市场,加之移动支付和拼购模式的成熟,社区团购的优势愈加凸显,其“线上预售+线下自提”的商业模式通过预售以销定采,降低库存,且具有需求频率高、资金周转快的优势,但同时也对供应链效率有了更高的要求,生鲜农产品作为社区团购的重要引流品类,其当前的物流配送网络尚不能满足社区团购客户的需求。本文通过对社区团购生鲜物流网络的现状进行分析,发现
随着科技的进步和移动互联网的横空出世,人们在手机端上网花费的时间越来越多。营销信息逐渐从PC端流向了移动端,信息流动的形式也越来越多样化、碎片化,而商品的流动形式则出现很多新的电商形态。因此越来越多的企业开始了数字化转型,这些企业通过在互联网上的一系列丰富的营销活动来吸引大量的客户,各大互联网公司这个过程中也掌握了大量的用户数据。但是在传统的营销模式或广告投放模式下,企业只能感受到一次营销投入带来
钢轨疲劳具有潜伏期长、隐蔽性高、易导致突然脆性断裂的特点,是既常见又危险的损伤形式之一,为线路的正常服役埋下了极大的安全隐患。微裂纹是钢轨疲劳的早期征兆,对其进行有效检测和及时干预可以严格把控风险,降低维保成本,防患于未然。然而,受检测原理限制,传统线性超声探伤方法对钢轨疲劳微裂纹并不敏感,漏检现象频发,严重威胁行车安全。相比之下,作为一种先进的非线性声学检测技术,振动声调制方法具有检测灵敏度高、
随着互联网技术的快速发展和移动端设备的普及,线上购物比线下更加方便、快捷。网上购物已经普及到人们的生活中了。各大电商平台迅速抢占市场,经过几年的发展后,市场达到饱和。由于竞争激烈,价格透明,宣传投入增加,导致传统电商平台的获利放缓。随着微信等社交网络的普及,微信使人们联系更加紧密,人们通过社交网络分享好物,一起购买。所以,社交电商的推出顺应了时代的发展。系统通过社交网络推广用户购买产品,同时会返回
近年来,我国城市轨道交通发展迅速,截至2020年底,大陆地区城轨交通运营里程已达7978.19千米。然而随着城轨交通规模的快速扩大,随之而来的能耗问题也日益突出,以北京地铁为例,2019年总耗电量达20亿千瓦时以上。为了降低列车运行能耗,可以利用超级电容、锂电池和飞轮等储能装置吸收和利用再生制动能量。由于超级电容具有功率密度高、循环寿命长的优点,地面超级电容储能系统在国内外城轨交通中得到日益广泛的
信息技术的迅速发展改变了商业世界的运作方式。电子商务和网购处于快速发展的黄金时期,网络零售商丰富的营销战略使网络零售额激增,尤其在电商节或节假日等网购大促期间。订单的激增导致网络零售商面临较高的物流和库存压力,尤其是在促销高峰期间,供需不匹配严重加剧,激增的物流压力可能会导致库存积压以及较低的客户满意度。此外,当需求激增时,企业的运作方式会在很大程度上受到消费者行为的影响。“需求侧”的消费者行为越
连锁便利店以品类丰富、店铺面积小、选购方便、选址近人流聚集区等优势得以快速发展,近年来便利店商品结构中的鲜食占比不断增加,SKU种类也在不断丰富。便利店自建的鲜食加工中心一般规模与产能有限,会同时面临多产品、小批量、多批次、短周期以及市场需求不确定性等压力。除此之外,鲜食本身又具有高易腐性、不宜长期储存等特点,这大大提高了便利店对于鲜食管理的难度,也导致生产计划期内的总成本居高不下,尤其缺货成本、
近年来,随着互联网日益发展,线上零售业也日益崛起,成为传统零售业新的拓展模式。此外,由于线上零售具有方便性、多样性、易操作性,部分消费者更加倾向于线上消费,该情形势对传统线下零售业带来不小的冲击。继而,传统线下零售为了吸引消费者,也在不断寻找新的增长点,不断拓宽其线上业务,并将其线上和线下两个渠道进行融合。在这样的背景下,出现了越来越多的以线上渠道和线下渠道融合的零售业。同样地,以社区超市为背景的
随着科技水平的进步和医疗信息化的发展,医疗数据在临床研究者中的大量使用需求对临床研究数据提出了共享的要求。传统的数据共享主要是采用中心化方式,数据由单方控制共享给多方,而在数据量日益庞大的如今,数据存储着人类社会的各种丰富的信息,中心化的数据共享方式存在着严重的安全隐患,由此引发的后果也不堪设想。近年来,区块链技术成为社会关注的热门技术,该技术的去中心化、防篡改、可加密、可溯源等特点,能很好的保证