快速运动估计及镜头边界检测的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:sheng198208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的高速发展,视频数据高效、实时的传输,需要按照一定的视频压缩标准进行编码。运动估计作为视频编码过程中的核心步骤之一,其优劣程度直接关系到视频压缩编码的效率,并且时间复杂度方面,它是编码过程中最高的。时代的发展,传统的视频检索技术逐渐退出历史舞台,基于内容的视频检索技术展露锋芒,而基于内容检索中压缩域的检索技术备受人们关注。本文正是基于上面内容,首先分析了立论的背景及意义,回顾了视频压缩标准的发展历程,介绍了运动估计的研究现状,阐述了镜头边界检测实现价值等,总结和归纳出待研究的难点问题及研究主线。其次,针对UMHexagonS算法搜索过程中,引入许多不必要的搜索点,提出了一种改进方案。该方案将搜索区域进行细化,并采用了两种初始点预测方式。根据初始点的预测效果,采用不同的搜索策略,减少了搜索点,优化了搜索路径。最后,对视频镜头边界检测,进行了研究和探讨。压缩域中,运动估计得到的运动向量,能很好的反映出视频对象的行为特点,对其关键信息的提取来进行镜头边界检测,成为关注的焦点之一。于是,在MPEG视频流中快速分割镜头算法的基础上,提出一种改进方案,通过提取运动向量的信息来进行镜头边界检测,并能达到较好的性能。
其他文献
无线自组织网络路由协议根据不同的策略从已经建立好的拓扑中选择一条或多条相互连接的链路组成路径,来进行数据包的传输。当拓扑中存在如“热点”这样的特殊节点时,路由协议
目前对异构数据库的交换、信息访问和检索的需求变得越来越重要,相比之下,访问异构数据库需要处理不同的模式、不同的数据模型、不同的查询语言以及不同的接口。   本文旨在
网络、3G技术的发展促进了视频通信领域中具有较高压缩效率、更好的网络健壮性的视频压缩标准的应用和研究。但视频压缩编码的计算密集性和数据密集性依然是H.264/AVC等标准
医学图像三维可视化是一种将传统的计算机图形学的相关知识运用到医学领域中,在计算机上对医疗设备获取的二维断层图像,通过图形学技术的处理和转化,根据视觉原理显示为直观
自从曼德尔布罗特(Mandelbort)引入分形概念以来,分形作为一门新兴的非线性学科,受到了学术界的广泛重视。分形理论主要描述自然界与非线性系统中不规则的、具有自相似结构特
在当前信息技术高速发展的后PC时代,嵌入式系统已经广泛地渗透到人们的日常生活等方方面面中。IT技术大融合及“三网融合”加速了嵌入式系统产业化进程。随着家用电器向数字
作为一种生物认证识别技术,说话人识别技术具有远程控制的独特优势,在互联网发展日新月异的今天拥有非常广泛的应用前景。近年来出现的说话人识别主流方法如GMM-SVM, JFA 和
随着网络规模的日益扩大,网络上经常会出现偏离正常网络行为的异常流量。这些异常流量不仅会造成网络性能下降,更严重的会造成网络瘫痪。因此,如何在大规模网络环境下进行网
面向主题是数据仓库的特征之一,面向主题是指数据仓库中的数据是按照主题进行组织的,合理地选取主题是数据仓库设计成功的前提条件。没有正确、合理的主题,就无法合理地组织
无论何时,人们都希望在第一时间得到问题的答案。为此,自动问答一直是人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。随着硬件的强有力支持,以及