关于音乐的检索研究——基于旋律的哼唱音乐检索

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:hailongsky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着多媒体及网络技术的飞速发展,多媒体信息的数据量急剧的增多,人们已经不能满足于通过歌名、歌词、演唱者等信息进行的文本检索。特别是当人们只记得歌曲的某一旋律片段时,如何快速的通过音乐旋律来检索相关音乐就成为了现在急需要解决的问题。   基于旋律的哼唱检索技术现己成为当今的研究热点之一,但直到现在它还没有被广泛的推广起来。这主要是因为,现在大多数的哼唱检索系统都是基于对MIDI音频文件的检索,并且对哼唱者及哼唱环境有着严格的要求。在现实生活中,人们接触到的都是MP3格式、WMA格式及WAV格式的音乐文件,MIDI格式的音乐文件少之又少,因此如何对MP3等格式的音频文件进行哼唱检索,并且哼唱条件适用于普通大众,这就是本文解决的问题。针对上述要解决的问题,本文主要做了如下几方面的工作:   1)通过对声音特征参数的分析,从中选出决定乐曲主旋律特征的参数。这一特征参数要满足:不管什么人、用什么样的方式演唱,只要音调相同,特征参数就要相同。   2)由于本文要检索的是带有背景音乐的音频文件,因此本文通过对常见音符音高值算法的分析研究,提出了一种新的音符音高值算法。这种算法不但计算量小,同时也降低了背景音乐对检索工作造成的困扰。   3)通过对音阶与音高间存在的特定关系的分析,在常见的旋律匹配算法的基础上,针对它们各自的优缺点提出了一种改进的字符串匹配算法,进而提高了匹配检索的准确度。   4)最后在上述分析的基础上,实现了在普通环境下对MP3、WAV等不同格式的音频文件的哼唱检索,并对多种不同的情况进行了仿真实验比对及结果分析。
其他文献
如今无线通信技术迅速的发展,为人们获取越来越快速可靠的传统通信服务和高速数据通信服务提供了可能,同时与现代社会信息资讯频繁交换的迫切需要达成了一致。多输入多输出技
叙述了金属型内衬砂套离心铸造ZQCuCo3CrRE球轴承保持架的工艺设计原则,介绍了金属型内衬砂套工艺过程及其特点,分析了球轴承保持架铸件产生缺陷的要因及预防措施。结果表明,
随着科学技术的飞速发展,人类对计算机网络资源的需求急剧增加,由此带来的信息安全问题也日益严重。层次访问控制是一项重要的信息系统安全机制,广泛应用于企业、政府机关和
移动互联网的飞速发展,丰富了人们生活的同时,也对蜂窝网络提出了更高的通信需求。为此,各种类型的蜂窝大量部署。然而基站数目的增加不可避免的会带来更大的能耗。考虑到经
本论文重点研究了基于体域网的移动健康护理平台的方案设计以及平台下业务功能的实现方法。   论文在简要介绍体域网及移动健康医疗的基础上,设计了面向医疗健康服务的移动
虚拟网络映射是一种解决未来互联网发展问题的关键技术,该技术能够使多个异构的虚拟网络共存于同一个物理网络,共享底层资源。传统的虚拟网络映射算法大多是针对网络负载较高
水下传感器网络(Underwater sensor network,简称UWSN)是构成水下环境立体监测系统的重要部分,它由大量具有感知外部环境、计算和通信能力的传感器节点组成,各节点被分布在指定
文章在介绍级联码、迭代译码算法以及软判决的基础上,系统阐述了 Turbo码的基本概念、关键技术及其在现代移动通信系统中的应用。
多点协作(CoMP)技术是LTE-A的关键技术之一,能够显著提高小区吞吐量和边缘用户速率,但是要实现CoMP传输,基站需要获得协作区域内所有用户与基站间的全部信道信息。虽然信道信
EPON技术作为以太网技术和无源光网络技术的结合,天然具有无源光网络技术的高带宽与设备无源的优点,同时与目前获得大规模应用的以太网设备之间不需要协议转换,是解决称之为