【摘 要】
:
行人的再识别研究在社会治安领域和商业领域受到越来越多的重视,其中大量的行人再识别研究都是基于图像和视频的计算机视觉领域方法,通过使用不同的再识别技术在不同设备的图像视频中检索出需要的用户。随着智能便携设备的普及,人们在日常生活中产生了海量带有地理位置的移动轨迹数据,而利用历史轨迹数据对行人进行再识别却并未获得足够多的关注。本文采用呼叫详细记录数据作为移动轨迹数据,首先采用改进的聚类算法、马尔可夫模
论文部分内容阅读
行人的再识别研究在社会治安领域和商业领域受到越来越多的重视,其中大量的行人再识别研究都是基于图像和视频的计算机视觉领域方法,通过使用不同的再识别技术在不同设备的图像视频中检索出需要的用户。随着智能便携设备的普及,人们在日常生活中产生了海量带有地理位置的移动轨迹数据,而利用历史轨迹数据对行人进行再识别却并未获得足够多的关注。本文采用呼叫详细记录数据作为移动轨迹数据,首先采用改进的聚类算法、马尔可夫模型、朴素贝叶斯模型和混合高斯模型等机器学习思想研究手机用户重识别问题。在此基础上考虑了轨迹的时空性质,建立一系列深度学习模型用于研究用户重识别问题,结果表明深度学习方法较传统的机器学习方法有明显提升。本文的研究内容主要包含以下几个方面:1、为了更好理解用户的行为模式,本文采用数据挖掘和统计分析的方法分析来源于上海市一万个用户群体的呼叫详细记录数据。通过统计用户在一定距离内的基站对共同访问次数,发现用户的基站对共同访问次数的互补累计分布函数服从指数分布。同时,通过原始数据的统计分析,发现呼叫详细记录数据的时间、空间维度分布存在时空不匹配现象。2、在分析用户的行为模式的基础上,本文采用改进的聚类算法、朴素贝叶斯模型、马尔可夫模型、混合高斯模型以及常见的轨迹相似度计算用户之间的轨迹相似度,进而匹配出同一用户的不同轨迹。实验得出各方法的用户重识别准确率,其中朴素贝叶斯模型准确率为0.735;马尔可夫模型准确率为0.830;混合高斯模型准确率为0.904;改进的聚类算法0.894;最小化期望平方0.702;轨迹分布KL散度0.765。上述方法从轨迹点访问频率的最大后验概率、轨迹点的状态转移概率、时空不匹配、轨迹点重合度等角度计算轨迹相似度。本文还研究了连续相同轨迹点对用户重识别准确率的影响,结果表明随着连续相同轨迹点长度的增加,准确率出现幅度较小的下降,这也说明了呼叫详细记录数据前后轨迹点存在时空相关性。3、本文从信息检索的角度出发,利用孪生网络结构计算轨迹之间的相似度。首先,利用自然语言处理领域的思想处理移动轨迹数据,将嵌入网络、长短期记忆网络和注意力机制网络的组合作为孪生网络的基本单元,通过对时间和空间两个维度编码,提取出重要的特征,然后将特征结合经过全连接层转换为二分类问题,其准确率达到0.907。但这种模型结构得出的结果不稳定,会随着正负样本构造的随机性产生标准方差为0.06的波动。针对上面模型的缺点,将嵌入网络、长短期记忆网络、注意力机制网络和对比损失函数作为孪生网络的基本单元,准确率达到0.923,并且波动的标准方差仅为0.03,提高模型准确率的同时,解决了模型不稳定的问题。4、城市的基站群体密集,基站之间存在空间依赖性。上述方法简单的采用嵌入网络构造基站之间的空间依赖性。基于此本文创新性的提出将图卷积网络作为孪生网络的基本单元实现用户重识别任务,这种做法可以更加精确的构建空间依赖性。因为基站数目众多,总共有39050个基站,训练难度大。所以本文设计一种基于DBSCAN算法和K-Means算法的混合算法对城市中的基站群逐步聚类,共聚为919个簇,计算每个轨迹点距离中心基站的欧式距离,取其倒数作为邻接矩阵的权重。将用户的移动轨迹是否属于该919个簇作为特征,构建特征矩阵输入到两层图卷积网络,然后将得到的轨迹特征向量送入长短期记忆网络捕获时间维度的相关性,最后将两条轨迹的向量表示进行拼接,输入到全连接层。该方法的用户重识别准确率达到了0.85。虽然该方法没有达到上述第三条中的模型的准确率,但该方法在其它时空轨迹数据集上的用户重识别更具有一般性。本文研究手机用户的再识别率所采用的方法,不仅可以应用到城市人流预测、城市规划、传染病防控和应急预警,同样可以在保证数据信息量的同时保护用户数据隐私。本研究可以更好的便利人们的生活,例如可以将不同平台的属于统一用户的身份信息数据匹配,完善商品推荐系统,实现智能化和便捷性消费。
其他文献
公司法改革后,资本缴纳制度变更为认缴制,赋予了股东极大的权利,股东可以通过公司章程来进行自由安排出资的相关事宜。这种认缴的出资方式虽然降低了公司成立的门槛,但是却对公司债权人利益的实现产生了一定的负面影响,特别是公司章程中约定的出资期限未至,但公司无力清偿到期债务,甚至部分股东在公司章程中约定了不符合实际情况的出资期限,这就使得公司债权人实现自己的债权面临着很大的现实阻碍。从现有法律规定来讲,只有
三维重建是一项涉及计算机视觉与计算机图形学等多门学科的技术,其本质就是将现实世界的真实场景通过数字化手段再现出来。如今,该技术被广泛应用到智能驾驶、文物修复、影音娱乐等各个领域。商用深度相机如Kinect的出现使得低成本、高性价比、易操作的三维重建成为可能,然而受设备条件限制,由Kinect采集的深度图像会受噪声影响并出现空洞现象,此外深度图像转化为点云后进行配准时出现的误差也会影响模型精度。因此
2020年的新年伊始,新型冠状病毒肺炎(以下简称新冠肺炎)疫情先在武汉爆发,然后迅速在全国蔓延开来,一场没有硝烟的战争就这样悄无声息的拉开了序幕。随着疫情逐渐得到控制,全国各地的中小学陆续复学、复课,从而开始了一场针对教育界的严峻考验。由于长时间的居家隔离生活,学生肥胖、身体素质下降等情况层出不穷,在复课初期小学生迫切的心情和急切的愿望在走出家门的那一刹那得到释放。由于小学生生性好动但运动能力薄弱
在大数据和分布式的发展中云环境下的存储方式也伴随着技术革新,从本地存储发展到云存储,从本地运维到第三方托管。存储方式的变革影响着技术的发展,其中同态加密是云存储中实现数据保护的重要方法之一。同态可以利用密文运算的特性可以解决用户数据的机密性和隐私性保护。经过近年的发展同态技术已从理想方案发展到现实应用中,而基于环上的线性误差学习同态加密方案,是同类型中应用最广、效益最高的。虽然同态方案有存储属性优
沃尔夫冈.阿玛德乌斯.莫扎特,十八世纪古典主义时期的伟大代表,是音乐史上罕见的音乐天才,在他短暂的三十五年生命中创作了诸多体裁的音乐作品。歌剧占据了莫扎特的创作中重要的一部分,他突破了格鲁克提出的歌剧要绝对服从戏剧,提出歌剧应发挥出音乐在刻画人物的心理、性格、情感等方面的作用,剧中每个角色都应具有强烈的个性,随着心理的变化剧情的发展而赋予其不同的音乐表现。莫扎特一生创作了 22部歌剧,其中最具代表
《永别了,武器》是美国作家厄内斯特·海明威的长篇小说之一。自出版以来,中外学者对其开展了多角度的研究,但对海明威的写作风格与罗兰·巴特零度写作理论之间的比照研究较为薄弱。实际上,海明威的创作理念和写作风格与巴特的文学创作观相契合,零度写作的主要特征在《永别了,武器》的创作技巧、叙述手法以及内容表达上有着明显的体现。创作技巧上,海明威采用凝练的措辞和直观的布局,以呈现作品的中性本真状态。在措辞方面,
作为社会关注热点之一的青少年体质健康问题,少年强则国强,青少年的健康成长与国家发展息息相关。青少年参加户外运动能够弥补学校体育课的不足,同时达到培养运动兴趣、增强青少年体质,活跃大脑思维的积极目的。现阶段国家出台了一系列推动青少年户外运动的政策,对其长远发展十分利好,并且青少年户外运动已经取得了明显发展和进步,但相比一些国外发达国家,我国青少年户外运动的起步较晚,在开展过程中仍然存在不足,为了青少
随着人工智能、云计算等技术的快速发展,人体行为识别已经成为当前的一个热点研究方向,并广泛应用于智能家居、智能医疗及智能工厂等领域,同时伴随着微型传感器和智能硬件的发展,基于可穿戴传感器的人体行为识别得到广泛应用。人体行为识别面向的行为类型主要分为三种:静态行为(站立)、动态行为(走路)和转移行为(站立-走路)。目前,大部分的研究集中在静态和动态行为的识别上,对于转移行为的研究还存在着不足,而转移行
5E教学模式作为一种新兴模式,在国外被广泛应用。近几年才在国内发展开来,由于研究时间尚短,发展比较缓慢。本研究通过采用5E教学模式来进行初中生物活动课的教学,激发学生对生物学习的兴趣,培养学生的动手操作能力、创新意识和探究能力,提升学生的生物科学素养,为教师在生物活动课的教学中实施5E教学模式提供一种可以借鉴的思路与方法。本研究通过文献研究法、问卷调查法、等组实验法、课例研究法以及非结构式访谈法,