基于音视频融合的定位跟踪算法

来源 :天津大学 | 被引量 : 0次 | 上传用户:Happyboy123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标定位跟踪技术在军事目标跟踪、监控系统、说话人识别等许多领域都有广泛的应用。传统的音频和视频跟踪方法利用单一的音频信息或视频信息进行跟踪,在复杂环境下鲁棒性差,研究复杂场景中具有鲁棒性和实时性的跟踪方法具有重要的意义。因此本文对基于音视频信息融合的定位跟踪算法进行了研究。本文首先研究了音频跟踪技术和视频跟踪技术。音频跟踪部分主要介绍了基于时延的麦克风阵列声源定位算法,并重点研究了广义互相关时延估计算法。视频跟踪部分主要研究了利用均值偏移算法的目标跟踪方法,利用目标的颜色特征实现跟踪,并对其进行了仿真。均值偏移算法是一种基于密度梯度上升的非参数化方法,通过迭代运算寻找目标位置,具有计算量小,实时性强的优点。然后,对粒子滤波进行了介绍,它是重要的信息融合工具之一。粒子滤波是蒙特卡罗方法和贝叶斯滤波方法的结合,通过预测和更新两个步骤迭代地估计系统的状态,用一组加权的粒子来表示目标状态的后验概率估计,适用于非线性非高斯系统,并具有从目标暂时丢失中恢复的优点。之后,提出了一种粒子滤波框架下的音视频融合跟踪算法。利用麦克风阵列通过基于时延的声源定位算法获取音频信息,从摄像头得到的视频序列中获取颜色特征信息。为增强跟踪系统的鲁棒性,利用粒子滤波融合音视频两部分的信息来进行跟踪。为了增强跟踪系统的实时性,将均值偏移算法嵌入粒子滤波中。
其他文献
软件定义网络(SDN)的广泛应用,正在快速从传统的数据业务网络架构朝着光网络的方向发展和迈进,这将给光网络增加新的意义和价值。光网络有了SDN技术的支持,可以使传统的数据
在未来的无线通信中,随着人们对多媒体及实时的流媒体业务需求的增加,对无线通信系统的传输可靠性和速率提出了更高的要求。而要在有限的频谱资源上实现通信系统的高速率和大
多输入多输出(MIMO)技术和正交频分复用(OFDM)技术的应用能够显著提高通信的传输速率,但终端配备多根天线的要求限制了MIMO的实际使用。协同中继技术可以在终端配备单根天线
在实际环境中进行语音通话时,通话双方容易受到周围环境的背景噪声的影响,从而影响通话的效果。这种现象在一些特定的应用环境尤为明显,例如在工厂,机场及一些军用场合,强烈
大规模多输入多输出技术(Massive Multiple Input Multiple Output,Massive MIMO)通过在发射端或接收端配置大量天线,能够提高系统容量并节省发送能量,已成为下一代通信技术
空间复用技术由于其较高的频带利用率,成为解决下一代移动通信高速传输的有效方案之一。本文通过对Turbo-BLAST系统的编码和译码算法进行研究,分别针对信道交织器、停止准则
频谱效率是未来移动通信系统设计中最重要的指标之一,为此李道本教授提出了广义并行传输的重叠复用概念。其中重叠码分多址接入(Overlapped Code Division Multiple Access,
目前光纤色散和偏振模色散成为制约光纤通信系统向高速率和长距离传输发展的主要因素。色散导致光纤中的光信号在传输过程中产生失真并且随着传输距离的增加变的越来越严重。