跨设备识别用户及其行为研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:waterdrop505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种智能电子设备在人们生活中的广泛应用,比如智能手机,平板电脑,笔记本电脑等各种移动智能设备,人们越来越倾向于通过不同的智能设备来完成相同的任务。然而,当用户在不同智能设备之间来回切换完成任务的时候,他们的识别信息就会变得非常模糊,以至于难以追踪到他们的踪迹。广告商希望能够找到使用这些设备的用户而不是设备本身,这样便可以针对用户所要完成的任务来做一些精准营销。因此,近些年来跨设备识别用户逐渐成为了一个热门的研究主题,它对于提高广告营销的价值以及提升用户的体验具有重要的意义。近些年来,很多普通的家庭或者个人都拥有多个可以连接互联网的智能设备,随着物联网时代的来临,智能设备更会呈现爆发式的增长。广告公司总是希望无缝地连接到设备背后的消费者,而不是设备本身。传统的办法是利用一些确定性的特征,比如电话号码,身份证号,电子邮箱等,这些特征需要用户主动提供,类似于我们日常使用的登录帐号。当用户在不同智能设备之间来回切换时,根据确定性特征便可以唯一确定一个用户。然而,出于对隐私性和安全性的考虑,用户很可能会拒绝提供他们的私人信息,这就给跨设备识别用户带来了很大的困难和挑战。针对传统跨设备识别方法的不足,近些年来已有一些学者对传统方法尝试了不同的改进,大多数研究以分析用户行为的一致性为基础。随着机器学习的兴起,一些学者提出基于概率的机器学习方法来预测用户拥有某一智能设备的概率,很好的提升了跨设备识别的准确率。然而,跨设备用户的行为数据的规模通常是非常巨大的,而且非常稀疏,现有的一些研究通常都面临着数据规模以及时间消耗的问题。本文在跨设备识别用户的需求越来越强烈的背景下,通过分析以及处理了大量的用户跨设备行为数据,充分对比了现有的机器学习方法的优缺点,并讨论了时间消耗以及数据稀疏性的处理问题,提出了基于优化提升的FFM模型,解决了跨设备识别用户的问题。本文贡献如下:1)用户行为分析及其特征空间:对跨设备用户行为进行了详细的分析,并对数据进行了较完整的预处理,通过分析特征之间的关系生成了更加完整的特征。同时对数据的缺失值进行处理,进行了One-Hot编码,数据标准化等处理,使预测结果更好。2)不同算法之间的比较:充分比较了可用于解决跨设备识别用户问题的八种机器学习模型,比较了它们在不同数据集上的表现,同时讨论了不同模型的时间消耗问题,得到了XGBoost是较好的处理这个问题的模型的结论,并探究了XGBoost模型的最优参数选择问题。3)提出了基于优化提升的FFM模型:对于大规模数据的稀疏性问题,FFM模型能较好的进行处理,我们在它的基础上,根据跨设备用户行为的地域特征,提出了基于优化提升的FFM模型。模型不但能解决大规模数据的稀疏性问题,而且在十一种模型的对比实验结果上表明,我们的模型具有更好的实验结果以及更稳定的特性,同时我们探究了模型的参数选择最优化问题。
其他文献
随着网络规模和复杂性的不断增长,对网络测量提出了越来越高的要求,并极大地推动了网络测量技术的研究与发展。由于传统的网络测量方法受到的限制比较多(主要表现在传统的网络
随着社会的发展,科技的进步以及计算机网络的普及,利用人体生物特征来鉴别个人身份的生物识别技术成为安全验证的首选方式。同其它生物特征识别技术相比,人脸识别技术具有操作简
人脸识别是模式识别领域中的一个涉及面非常广的重要研究方向。由于人脸图像在采集时受环境、光照、表情和姿态等多种变化的影响,使得人脸识别研究极富挑战性。如何快速准确
随着网络信息技术的向前发展,尤其是互联网应用的不断增加和网页信息的指数级增长,要在互联网中准确、快速地找到自己所需要的信息,搜索引擎是一种必不可少的工具。但是,百度
医学图像配准与拼接技术作为一个极具特色的研究领域,它不仅有效地综合了各种医学影像信息,同时为临床诊断提供了新思路,是当代医学领域的前沿性课题。本论文主要研究了基于
多词表达是指由两个及以上具有一定的句法和语义关联的词语构成的意义相对完整的语义单元。多词表达问题是目前自然语言处理领域最棘手的问题之一,多词表达会导致分词和语义
IP多媒体子系统(IMS)是由第三代伙伴组织(3GPP)提出的下一代网络(NGN)的核心子系统。它基于全IP的网络,同时支持固定和移动网络接入,并且为多媒体业务提供了一个通用平台,使运营
智能移动机器人路径规划是移动机器人导航技术中最重要的环节之一,它是指在给定智能机器人及其工作环境信息下,按照一定的优化指标,在起始点和目标点之间规划出一条与环境障
随着信息技术和无线通信技术的迅猛发展以及在各个领域的不断渗透,信息系统在医院的应用也在不断深入,这些方面促使医院的工作效率和医疗服务质量得到显著提高。现代信息技术
随着多媒体技术与网络技术的融合,视频、图像类的应用已对人们生活的各个方面产生影响。对视频、图像类业务的研究开发已经成为当前计算机学科的热门课题。视频、图像编码技