基于深度卷积神经网络的行人属性识别技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yizhutingyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的大数据时代,智慧城市的理念与建设蒸蒸日上,作为和谐社会的安全保障,监控摄像头可谓随处可见。监控视频下的行人属性识别通过统计整合信息实现对行人的信息结构化,这对于智能安防、刑事侦查、广告精准投放等领域具有至关重要的作用和意义。但是由于监控视频场景复杂,而且行人属性类别间的相关性和属性类别与空间位置间的关联较难挖掘,行人属性识别任务仍具有挑战性。
  本文提出的基于语义分割的行人属性识别方法,针对行人属性识别的任务和数据特点,设计了基于视觉注意力的多分支网络结构,充分利用语义分割的优势,将属性语义信息视觉注意力和人体解析生成的空间注意力有效地融合。具体地,对于通用目标检测效率较低的问题,设计针对行人目标的实时行人检测算法,实现了速度与准确率的良好平衡。在行人跟踪方面,采用较为稳定的深度联合度量实时在线跟踪方法,并且为了提升行人库中的图像质量,对于同一个行人目标的图像采用通用图像质量评估方法进行筛选。在行人属性识别方面,针对行人属性识别中的数据分布不均衡问题,以及难以挖掘的属性之间的关联性,提出了带权重的多任务损失函数,并设计了基于视觉注意力机制的多分支残差网络。为了更好地利用行人属性类别与空间位置分布之间的关系,引入语义分割辅助信息,人体解析网络融合了分割图的语义特征表达和边缘图的边界感知特征,采用自我校正的迭代训练策略进行模型的训练。提出了人体解析分割图与属性识别特征图的融合方法,有效地将人体解析带来的空间信息应用到属性识别网络中,实现了属性之间以及属性和空间之间的强关联,并在基准数据集WIDERAttribute中取得了83.4%的较高准确率。
其他文献
目标检测技术是计算机视觉领域内的研究热点之一,其成果被广泛应用于智慧安防、自动驾驶等领域。随着深度学习技术的发展,目标检测技术取得了突破性的发展,但对于小目标和低清目标的检测精度仍有待改进,这使得目标检测技术在实际应用中依然有很大局限,所以如何设计能够准确检测小目标和低清目标的算法对于推广目标检测技术的应用有重大意义。  立足于目标检测技术对于小目标和低清目标检测不够准确的问题,通过研究突破相关技
学位
目标跟踪是计算机视觉领域最热门且最具挑战性的研究内容之一,在自动驾驶、视频监控等领域有着广泛的应用。近年来,基于深度学习的目标跟踪方法因其对深度架构的使用,更具表现力的深度特征等特点在目标跟踪领域引起了广泛的关注和研究。其中孪生区域候选网络SiamRPN从目标检测领域获取灵感,将孪生网络和区域候选网络相结合,在保证实时的同时,取得了较高的准确性。然而SiamRPN使用AlexNet作为骨干网络,受
学位
随着智能设备的普及应用,日常生活中产生了大量的碎片化短文本信息,例如,手机短信,社交动态分享,搜索语句,商品评论等。为了从这些海量的短文本信息中挖掘到更多的潜在商业价值,短文本分类任务受到越来越多的关注。由于短文本数据的独特属性,使其相较于长文本分类更加困难。一方面,短文本一般短小简洁,语法不规范,导致其特征稀疏,信息匮乏;另一方面,短文本更新速度快,数据量大,但是缺乏大量的带标签数据用于训练。 
随着全球互联网发展的加速,产生了海量蕴含丰富关系信息的文本数据,自动分类文本中的实体关系变得尤为重要。传统关系分类方法依赖大量标注数据且难以泛化到新关系类别中,而少样本学习则能够通过学习少量标注样本,快速在新类别上泛化,少样本关系分类因此开始受到学界关注。  深入研究了现有少样本关系分类算法并分析了各自优劣,其中图神经网络(Graph Neural Network, GNN)模型能较好地在支持集与
学位
流表更新在软件定义网络(Software Defined Network, SDN)中是十分频繁的,若不能保证流表规则的一致性更新,则可能导致网络中出现黑洞、传输环路、链路拥塞等情况,从而影响网络的性能。如何进行流表的一致性更新以确保数据包在更新期间的正常传输一直都是被广泛研究的问题。现有研究方案有的不能同时保证更新过程无黑洞、无环路、无链路拥塞,有的则太过于复杂会影响更新时间,有的则会消耗额外的
对于智能手机平台上的增强现实应用,结合手势这种直观的交互方式能给用户带来更自然的操作体验,对增强现实技术的发展很有意义。然而受限于手机的硬件性能和单目摄像头等条件,目前在安卓平台下还没有一套成熟且完备的解决方案来实现基于手势交互的增强现实系统。  本文设计并实现了一个应用在安卓平台上基于手势交互的增强现实系统,主要解决了手部位姿估计和动态手势识别两个技术难点,结合手势交互模块,实现了根据用户手势控
随着现代应用程序复杂度的不断提高,大规模的数据计算对程序和编程框架的并行性和可扩展性的要求越来越高。数据流编程语言COStream使用特定的文法描述计算任务,编译后将各任务均匀划分至不同的核上,能充分发挥多核平台的性能。但目前COStream语言的文法在编译阶段存在移入归约冲突,导致对运算符优先级的解析存在错误,且缺少内置的矩阵运算接口,影响了COStream数据流编程模型的可用性和易用性。  针
近些年来,物联网技术的飞速发展已经使得人、机、物三者的融合共生成为了一种不可逆转的趋势。人机物融合应用的发展现如今还面临着诸多挑战,如何在边缘场景下进行高效的资源调度是其中的关键问题之一。边缘场景下的人机交互应用会产生大量的数据,如果选择不在网络边缘侧处理这些数据,数据的传输过程将会给网络带宽带来极大的负担,同时数据传输所带来的高网络延迟也会让一些延迟敏感应用的使用体验感大大降低。但在网络边缘处理
学位
移动边缘计算作为边缘计算的一种实现形式,其在一定的程度上有效的弥补了云计算在实时性处理、带宽占用以及数据隐私安全方面的不足,并且在人机物融合应用方面具有十分良好的前景。但是,由于边缘计算所依赖的边缘设备本身所固有的携带能量有限、计算能力有限、存储能力有限的局限性,边缘计算在应用的过程中往往面临着各种各样的挑战。  针对移动边缘计算场景下,边缘设备接入接出灵活的特点,以及由边缘设备接入接出所引发的边
近年来,知识图谱由于其表达丰富信息的能力及其在基于知识的推理中的潜力而受到了广泛的关注。例如,它们可以协助(与移动服务中的用户关联,切换策略和流量内容)相关的深入知识发现。知识图谱嵌入可以将知识图谱中的实体和关系投影到密集且低维的向量中,并通过这种方式有效地测量复杂的语义信息以及这些实体之间的关系。但是,传统的知识图谱嵌入方法仅考虑知识图谱中的直接事实,在面对稀疏数据时,很难实现对实体和关系的合理
学位