基于深度表征学习的交通场景语义理解关键技术研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户：lszh2009

【摘要】

：

【作者】

：

丁松涛

【机构】

：

西北工业大学

【出处】

：

西北工业大学

【发表日期】

：

2019年01期

【关键词】

：

交通监控辅助驾驶系统深度学习图像语义理解视频语义描述

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,交通运输业发展势头迅猛,基于计算机视觉的交通监控系统的应用日趋普及,相应的大数据处理、分析与利用等问题成为研究者们关注的重点。基于机器视觉的图像语义理解作为一种新兴的前沿技术,通过收集目标检测和跟踪等底层视觉技术提供的信息为行为识别、事件搜索等高层视觉任务提供分析和推理,在交通图像处理系统中起承上启下的作用。在车辆辅助驾驶系统中,基于深度表征学习的交通场景语义理解是以所有交通参与者为对象,以理解场景内容为核心,研究图像内容的表达,其重点是为交通参与者提供车辆与行人的行为分析和场景内容描述,具有重要的研究价值。交通场景语义理解的本质是研究视频信息到文字描述信息的转换问题。该技术主要依靠检测到的交通监控信息对当前交通场景中的车辆特征、行驶状态、行人行为及道路环境等进行语义描述。本文针对交通场景语义理解及描述过程中遇到的诸多问题,在大量分析国内外相关文献的基础上,通过研究机器视觉与自然语言处理领域的关键技术,围绕智能监控系统的实际应用展开相关研究,旨在提高交通场景下图像语义理解算法的准确性、鲁棒性,使其能够满足智能交通监控系统的实际需要。具体开展的研究主要有:1.对基于时空兴趣点的目标检测方法进行讨论分析,并通过改进时空兴趣点实现人体行为的准确检测。复杂交通场景下的行人与车辆检测受到物体遮挡、背景杂乱、视角移动以及光线变化等因素的影响,一直是图像处理领域具有挑战性的课题。为了解决算法中存在的问题和不足,将多尺度信息引入兴趣点检测中,通过应用局部空间环绕抑制、时间约束及尺度自适应等方法,减少背景杂点的产生,提高目标检测的准确性。最后通过人体行为识别实验来验证和改善检测器的鲁棒性,同时抑制背景杂点的产生,提高检测器的性能。2.针对交通目标检测与识别过程中普遍存在尺度变化、背景杂乱、物体遮挡等问题,以及基于深度学习的目标检测算法在进行区域选择时滑动窗口遍历搜索耗时问题,提出一种基于改进时空兴趣点的交通目标感兴趣区域检测算法。通过应用时空兴趣点优化、多目标动态聚类及感兴趣区域构建等方法,提高了目标检测算法面对复杂交通场景时的鲁棒性。此外,由于模型只计算感兴趣区域内的特征,因此还减少了模型的计算时间,提高了交通目标检测的实时性。3.对基于深度学习的图像语义理解算法进行研究。针对图像语义理解模型在生成图像描述语句时遇到的主体目标选择模糊、冗余语句干扰以及对现实场景还原度低等问题,提出一种基于人类视觉注意力机制的图像语义描述方法。该算法通过对包含多种目标的复杂场景进行筛选,为语义模型产生准确且接近人类语言习惯的图像描述语句提供引导。基于刺激驱动的注意力机制源于视觉的独特性、不可预测性以及歧义性。该算法首先对图像中的特定区域进行注意力条件选择,然后根据区域选择结果进行注意力资源分配以及图像特征编码,最后将带有权重分布的图像特征输入语言模型中解码并生成图像描述语句。4.对基于机器视觉与自然语言处理的图像问答系统框架进行研究。针对问答系统模型结构相对简单,模型在回答问题时存在注意力偏差以及缺乏关系推理能力等问题,提出一种基于多目标关系检测的图像问答系统模型。首先对目标检测模型以及目标关系判定模型进行预训练,获得目标外观关系特征及目标之间的关系谓词。然后利用问题中所包含的单词引导注意力指向图像中的对应区域。最后,将图像外观关系特征与文本问题一起通过非线性转换到统一的向量空间,利用词向量相似性原理产生对应的答案。实验结果表明该方法能够有效增强图像特征与文本问题之间的关联性,在验证数据集上取得了较为理想的成绩。5.对长视频语义描述算法进行研究。针对长视频在进行内容分析与事件搜索时计算量大,事件定位不准确的问题,提出一种新的长视频语义理解算法。通过应用冗余视频帧检测、长视频超帧分割,关键帧选择等方法,将长视频转换为能够代表视频内容的文本摘要,在提高语义描述准确度的同时,减少了模型的计算搜索时间。综上所述,本文通过对基于机器视觉的目标检测方法以及基于自然语言处理的文本描述方法进行深入研究与分析,针对交通场景语义理解过程中遇到的目标形变、相似性干扰、遮挡、光线变化以及复杂目标关系等问题提出一系列解决方案,在对交通场景中的行人,车辆等目标进行准确检测的基础上,进一步实现了对交通场景的内容表达和客观解释。最后,梳理了文章的主要工作,对全文进行总结,并对下一步的工作进行展望,提出下一阶段需要重点研究的内容。

其他文献

Q315NS耐蚀钢弧焊接头腐蚀行为研究

工业生产使用的燃料中S、Cl和P等元素燃烧后生成酸性气体,接触到温度较低的金属构件时会与水蒸汽结合并凝结成酸性液体,对金属构件产生露点腐蚀。近年来,随着国内大气污染物排放标准趋于严格,烟气排放温度逐渐降低而造成相关设备的腐蚀防护压力逐渐加大。作为针对露点腐蚀服役环境开发的Q315NS耐蚀钢具有低成本、耐腐蚀性优良等特点,具有广阔的应用前景。Q315NS耐蚀钢的组织和性能会受到焊接工艺过程的影响而产

学位

Q315NS焊接接头电化学钝化活性溶解点蚀

比表面积测量能力验证计划的实践与探讨

比表面积是许多科学研究和工业应用领域中粉体、微纳米材料织构性质评价的重要参数之一,我国已经颁布的诸多关于粉体、微纳米材料的检测试验方法标准和产品标准均涉及比表面积的测量。本次能力验证计划旨在通过对参加实验室提交的能力验证计划样品比表面积测量结果进行比对和评价,考察能力验证计划参加实验室检测粉体、微纳米材料比表面积的能力。通过此次能力验证计划活动,参加实验室可以了解自身的检测能力以及行业的整体检测水

期刊

癫痫大鼠模型中小胶质细胞激活的脑区特点

目的探讨小胶质细胞在癫痫中的激活特点及其在癫痫中的作用。方法将12只Sprague-Dawley（SD）雄性大鼠随机分为对照组和癫痫组，每组各6只；癫痫组采用氯化锂-匹鲁卡品腹腔注射的方法造模，对照组给予等量生理盐水；癫痫发作4 d后取大鼠脑组织，采用蛋白质免疫印迹法（Western blot）和免疫组化的方法研究各组电离钙结合适配器分子-1（Ionized calcium binding a

期刊

癫痫小胶质细胞丘脑皮层环路梨状皮质丘脑室旁核

基于深度学习的几何习题课教学——以“三角形的内接正方形”的教学为例

习题课是中考复习中的一个重要环节，是知识回顾、整理及简单应用后的研究主题的延续与拓展.从中考的视角，看几何习题课教学，要力争达到“做一题、会一类、通一片”的效果.文章以“三角形的内接正方形”为背景，以问题串形式驱动深度学习，在定性分析中获得新的研究对象和研究思路，再从定量角度深入探究如何确定内接正方形，比较多个正方形面积的大小，从中获得一般性的规律，体会“从定性到定量”“从特殊到一般”的研究路径.

期刊

中考复习课问题串类比深度学习

论班主任如何指导家长进行有效亲子沟通

亲子沟通问题一直都是人们热议的话题,是每一位家长必须承担的责任。而青少年阶段的学生逐渐产生了强烈的独立意识,渴望独自与外界接触,与家长的沟通越来越少,分歧越来越大。针对这一现象,班主任除了要引导学生健康成长,树立正确的世界观、人生观和价值观外,还需要指导家长进行有效的亲子沟通,构建和谐的亲子关系。

期刊

亲子沟通家庭教育班主任

自动化动态吸附比表面积仪的研究与开发

超细粉末或多孔固体的表面能大,吸附作用明显,其比表面积测量具有较高的研究价值。目前的动态比表面积分析仪管路接口复杂,漏气多;人工操作频繁,精度低;气体温度易变,温差大。对比分析了国内外常压连续流动色谱法的工艺流程,提出了将动态比表面积分析仪管路集成模块化,变体积定标自动校准的设计思想,实现了集成管路恒温控制,吸附体积自动校准,气体流量自动测量等目的,减小了仪器体积,提高了测量精度,使测量过程高度自

期刊

板装模块连续流动色谱比表面积体积校准计算程序

宇宙背景辐射告诉了我们什么?

在科学的所有分支中,宇宙学大概是最玄乎的,因为它要以整个宇宙作为研究对象。宇宙学家研究宇宙就有点类似瞎子摸象,仅凭摸到的象鼻或者象牙就要推想出整只大象的样子来,其难度是可想而知的。所以,倘若你贴着宇宙学家的肚皮,把他们的心声都听一遍,那么不外乎是:新数据,新数据……这就不难理解,为何2013年3月21日对于他们来说,就像过节一样。因为这一天,欧洲宇航局发布了迄今分辨率最高的全天宇宙微波背

期刊

发现微波背景辐射的曲折历程

发现微波背景辐射的曲折历程○辛酉宇宙微波背景辐射是高度各向同性的温度略高于２７开的黑体辐射，这是一种充满宇宙各处的均匀辐射。微波背景辐射的发现被认为是２０世纪天文家的一项重大成就，它对现代宇宙学所产生的深远影响，仅次于哈勃对河外星系红移的发现。当前...

期刊

老挝中小企业融资研究

学位

宇宙背景辐射探测卫星

本世纪初对银河系本质和河外星系的认识是现代天文学发展上的飞跃,人类所知的世界在不断增大。尤其是射电天文学问世后,于60年代初发现了接近宇宙边缘的星系——类星体,它远离我们上百亿光年（天体有多少光年远,我们所看到的就是多少年的的过去）。星系的空间分布也不是均匀的,往往十几个,几十个,甚至几百个星系形成星系群和星系团,而多个星系团又形成超星系团。目前已发现上

期刊

宇宙学宇宙大爆炸暴胀微波背景辐射红外背景辐射

基于深度表征学习的交通场景语义理解关键技术研究

其他学术论文