基于内容的海量音频高效检索

来源 :太原理工大学 | 被引量 : 5次 | 上传用户:jakynum1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新世纪以来随着互联网在全世界范围的广泛普及、音频编解码技术的迅猛发展以及高容量存储介质的诞生,使得网络中的数字音频资源数量呈现指数级别的增长。海量的网络数字音频资源给人们带来了极大地便利,然而由于互联网数字音频管理体系和版权保护制度的不规范和不完善,网络用户可以随意的上传下载数字音频资源甚至对音频内容进行更改,这在无形中严重侵犯了数字音频资源版权拥有者的合法权益。数字音频的版权保护,如今已经引起社会各界的广泛关注,已经成为亟待解决的重要问题。依据新闻出版总署重大科技工程项目“数字版权保护技术研发工程”及国家科技部支撑项目课题“数字版权服务关键支撑技术研究”需求,本课题主要研究音频特征备案及高效检索的相关关键技术,最终实现在普通配置服务器设备存储的10万条规模的数字音频内容版权核心资源数据库中对未知信息音频片段进行检索定位,所需查询时间小于1秒,同时保证检索准确率达到90%以上。课题的研究对网络环境下的海量数字音频资源的规范管理、数字音频版权的有效保护以及数字音频内容的快速准确的访问等问题具有不容忽视的推进作用和重大意义。课题首先对基于内容的音频检索系统的国内外研究现状进行了详细的阐述,通过对目前现有的音频指纹提取方法及相关快速检索方法的全面总结与分析,围绕经典的Philips音频指纹,重点对其相关的快速检索方法进行深入探讨。最后设计了一种基于Philips指纹的海量音频高效检索系统,并进行大量实验验证。课题的主要贡献有:1)在Philips指纹的基础上引入bag-of-features算法,提出一种数据量相比Philips指纹成倍减少的高效、鲁棒的中间指纹进行过滤检索,可以在短时间内快速过滤不相关音频;2)相应地设计了一种基于阈值的固定间隔抽样匹配算法,大幅减少检索过程中相似度匹配的计算量,并有效地促进了中间指纹的过滤速度;3)结合Fibonacci哈希索引算法、中间过滤指纹、Philips指纹及基于阈值的固定间隔抽样匹配算法,设计并实现了一套高效的阶梯式音频过滤检索系统。经大量反复的实验验证,基于BoF和Philips指纹的中间过滤指纹具有极高的过滤速度和过滤幅度,同时保证检索的召回率和准确率,基于阈值的固定间隔抽样匹配算法在略微降低过滤幅度的基础上,可以有效地提高过滤速度和检索速度,最终设计的高效阶梯式音频过滤检索系统,在一台存储约为10万条音频指纹的普通配置PC上对10秒的未知信息音频片段进行批量检索,平均检索时间仅为0.15秒,检索召回率可达99.47%以上,检索准确率接近100%,圆满完成项目相关指标任务。
其他文献
<正>国际海事组织(IMO)海上安全委员会第99届会议(MSC99)于2018年5月16日~25日在英国伦敦IMO总部召开。会议由澳大利亚Brad Groves先生担任主席,共21项议题,主要包括《1974年
信息技术的飞速发展,不仅改变了整个世界的面貌,还推动了教育的全面变革。21世纪是电子信息时代,它象征着人类的时代跨越;随着时代的发展,信息技术发挥着越来越重要的作用,它正以惊人的速度影响和改变人们的学习方式。  在21世纪教育全面现代化的进程中,信息技术对现代教学将担负起重要的使命,因此我们有必要对其在现代教育中的应用有一个全面的认识。这就要求我们教师要跟上时代的步伐,认真研究、学习、信息技术的知
随着国内外贸易量的增长,长江流域经济快速发展,集装箱运量大幅提高,对集装箱运输能力和运输效率提出了新挑战。现代生产模式的发展,对运输批量和运输时间提出了更高的要求。同时
数学这门专门研究现实世界中数量关系和空间形式的科学,对于发展思维具有特殊的作用。小学数学教学的内容虽然简单,属这门科学的基础,但对于发展学生思维的能力有极其重要的作用。应用题教学是对小学生进行思维训练,培养小学生数学逻辑思维能力的最重要渠道,也是提高学生数学素质的重要途径。因此,应用题教学必须突出思维训练,展开思维过程,教给思维方法,培养思维能力。  引导学生在充分感知中展开思维。  思维的基础材