基于多特征融合的视频高层语义概念检测

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:lewy540
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着视频检索技术的快速发展,如何跨越语义鸿沟,使机器像人类一样更好的理解视频中的语义概念,满足用户对视频信息管理和检索的需求,已经成为目前迫切需要解决的一个重要问题。因此,视频高层语义概念检测技术已成为新一代多媒体搜索引擎的研究热点。本文研究基于多特征融合的视频高层语义概念检测技术,全面分析了底层视觉特征的提取技术,并提出了一些新的融合算法,主要内容如下:底层视觉特征方面,本文全面分析和比较了颜色、边缘、纹理等全局特征和SIFT、HOG等局部描述子特征的特点及其在视频语义概念检测中的性能。本文采用Bag-of-Feature关键点投影算法来组织和表达局部描述子特征,有效地量化了关键点特征,提高了分类器的训练速度;在此基础上本文采用了基于空间金字塔的特征匹配技术,克服了以往方法完全丢弃特征点空间信息的问题。另外,本文还引入了文本检索领域的PLSA算法,与空间金字塔技术相结合,在全体数据集上分析视觉词汇的上下文关系,进一步增强了视觉特征的语义表达能力,并降低了计算复杂度。系统融合算法方面,本文在特征级、核函数级和分类器级别上研究视频语义概念检测中的系统融合技术,提出了一种基于多核学习的核函数级系统融合算法和一种基于逻辑回归与线性加权分类器级系统融合算法,将不同视觉特征的优势有效地结合起来,增强了对视频中场景、物体、事件等多类语义概念检测的鲁棒性。在这些算法的基础上,本文还提出了一种结合多种融合算法的多层次融合框架,在实验中获得了更好的概念检测性能。在TRECVID 2009高层特征提取评测和TRECVID 2010的语义索引评测中,本文构建的基于多种底层视觉特征融合的视频高层语义概念检测系统均名列前茅。
其他文献
TD-SCDMA商用化正在国内如火如荼的开展,新一代宽带技术TD-LTE的研发工作也在积极的展开。作为TD-SCDMA/TD-LTE产业链中不可或缺的一部分,终端综合测试仪的应用贯穿于整个终端
阵列天线下视3DSAR通过在机载雷达交轨方向使用阵列天线形成跨航向实孔径,通过载机沿航迹方向的运动形成合成孔径,通过在距离向发射宽带信号并进行脉冲压缩,能够实现对目标场景
打破了“太大不能倒下”传统的雷曼破产事件只有在当前金融危机背景下才能理解,这起自大危机以来最大的金融机构破产案使陷入金融危机的国际市场雪上加霜。雷曼破产引发的高达6374亿美元债券违约给金融市场造成了巨大的冲击,使美国政府7000亿美元的救市资金显得杯水车薪,国际金融危机恶化为侵蚀实体经济的经济危机。拥有158年历史的雷曼可谓久经考验,经受了上世纪三十年代的大萧条和两次世界大战战火的洗礼,想不到在
随着三网业务的融合和宽带移动通信技术的进步,传统语音业务外的其它新型业务不断被开发以及应用。而伴随着新业务出现,传统的以话音为主的业务拨测系统对一些特定的测试场景
多输入多输出(MIMO)技术被认为是现代通信技术中极其重大的突破;但是,MIMO信道的特性,特别是天线之间的时空相关性,对MIMO系统大容量的实现和系统性能的提高以及MIMO系统中各种信
铁路运输作为一种主要的现代化运输方式,在我们的日常生活中扮演着十分重要的作用,因此保证铁路安全也是当今生活中一个重要的命题。钢轨作为铁路的重要组成部分,必须要有严格的
随着网络技术的飞速发展,人们在追求网络高速率、高容量的同时,开始越来越注重网络的生存能力。网络的生存性,即网络在发生故障时依旧能够保证一定的网络容量与服务质量的能力。
图像去噪是数字图像处理领域中一项十分关键的技术,是数字图像相关应用中的一个重要预处理步骤。尽管图像去噪算法已经被研究了近半个世纪,但仍然是最富有挑战性的课题之一,不断
本文使用名义增加值变化来表示成本红利大小,通过Ghosh价格变动模型推导了成本红利的计算公式。依据WIOD中国非竞争投入产出表,实证测算了2014年7月到2015年7月国际大宗商品
为满足对吞吐量和传输速率提出的更高要求,LTE-Advanced系统中引入了无线中继技术。目前,世界上主要的电信运营商和通信设备商都在积极地推动中继Relay的发展。中继技术能够有