论文部分内容阅读
音频指纹是指概括一段音频数据的基于内容的紧致特征。音频指纹技术是近年来音乐信息检索领域备受关注的研究方向,它在歌曲检索,版权保护,音乐库组织等方面有着广泛的应用。本文围绕音频指纹算法开展研究,重点分析了一种主流的音频指纹技术--飞利浦鲁棒哈希(Philips RobustHash,PRH),对PRH提出改进方法,设计并实现了一个基于移动电话的歌曲检索系统。
首先,分析PRH提取算法并改进鲁棒性。PRH对每一帧音频数据提取32位的子指纹。PRH在强失真下的鲁棒性仍需改进。本文对不同位的鲁棒性进行分析,挑选出鲁棒性较高的位组成新的特征,因此新特征的鲁棒性得到了增强,同时新特征的可靠性几乎不变。
其次,分析PRH匹配算法,加入剪枝策略,并建立高效的索引。PRH匹配算法利用倒排文档索引进行搜索。将歌曲看作文档,子指纹看作文档中的词,子指纹的索引指向它所在歌曲及歌曲中的位置。本文在搜索过程中加入剪枝策略,及时舍弃不匹配的候选,加快搜索速度。具体实现时,使用Lucene系统建立了高效的倒排文档索引。
最后,在上面研究的基础上,设计并实现了一个基于移动电话的音乐检索系统。与目前已有的类似服务不同,该系统不要求手机具有下载软件的功能,所有手机都可以使用该系统。该系统利用语音卡的双缓存机制进行录音,在数据库中检索录音片段。目前数据库有3万首歌曲,元数据包括歌名和歌手名。
实验结果表明,本文开发的系统能够准确快速地检索到结果。本文提出的方法有效地改进了系统性能。