音频指纹算法及基于移动电话的歌曲检索系统

来源 :北京大学 | 被引量 : 0次 | 上传用户:hfzxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频指纹是指概括一段音频数据的基于内容的紧致特征。音频指纹技术是近年来音乐信息检索领域备受关注的研究方向,它在歌曲检索,版权保护,音乐库组织等方面有着广泛的应用。本文围绕音频指纹算法开展研究,重点分析了一种主流的音频指纹技术--飞利浦鲁棒哈希(Philips RobustHash,PRH),对PRH提出改进方法,设计并实现了一个基于移动电话的歌曲检索系统。   首先,分析PRH提取算法并改进鲁棒性。PRH对每一帧音频数据提取32位的子指纹。PRH在强失真下的鲁棒性仍需改进。本文对不同位的鲁棒性进行分析,挑选出鲁棒性较高的位组成新的特征,因此新特征的鲁棒性得到了增强,同时新特征的可靠性几乎不变。   其次,分析PRH匹配算法,加入剪枝策略,并建立高效的索引。PRH匹配算法利用倒排文档索引进行搜索。将歌曲看作文档,子指纹看作文档中的词,子指纹的索引指向它所在歌曲及歌曲中的位置。本文在搜索过程中加入剪枝策略,及时舍弃不匹配的候选,加快搜索速度。具体实现时,使用Lucene系统建立了高效的倒排文档索引。   最后,在上面研究的基础上,设计并实现了一个基于移动电话的音乐检索系统。与目前已有的类似服务不同,该系统不要求手机具有下载软件的功能,所有手机都可以使用该系统。该系统利用语音卡的双缓存机制进行录音,在数据库中检索录音片段。目前数据库有3万首歌曲,元数据包括歌名和歌手名。   实验结果表明,本文开发的系统能够准确快速地检索到结果。本文提出的方法有效地改进了系统性能。
其他文献
随着计算机网络的普及与通信技术取得的一系列成就,以及人们对通信内容图像化、多样化的需求日益增加,多媒体传输应用已成为人们生活中不可或缺的一部分。视频会议、在线视频
随着互联网业务需求跨越式增长,移动互联市场规模极速扩大,云概念在各个行业兴起,当前网络数据中心的应用和发展有了更加广阔的前景,也促使机群规模不停的扩大。同时,SDN(Software
随着数字电影逐渐走入人们的生活,数字影院技术正经历着从无到有,再到被人们日益重视的高速发展阶段。与之相关的图像压缩解压,语音处理,数字加密等领域都引起了人们足够的重视。
BIBAC载体设计的具有许多优于YAC和PAC的方面。它不会出现重组交换而导致的基因嵌合现象,可以在大肠杆菌和农杆菌中进行穿梭;在农杆菌介导下能直接将外源基因整合到植物基因
期刊
摘要:小学语文的教学中,最常用的教学手段就是朗读,现今,朗读教学是语文教学中的一种形式,在阅读中培养学生的语感,能够加深学生对文章的理解和体会。朗读是语文教学中最基本的活动,在教学中切实指导学生读书,课堂上给充足的时间让学生去读书是一条可取之路。让我们在今后的语文教学中注重朗读训练,切实把语文课上成语言训练课。  关键词:培养兴趣 ;教学问题 ;教学技巧  一、朗读有助于发展学生的语言  教师在指
现有IP网络客户数量不断增多、业务应用形式逐渐增加,网络中承载的业务量急剧上升,网络资源日益紧缺;同时,各种网络应用需要满足一定带宽、时延、抖动以及丢包率等服务质量(Q
本文通过对荣华二采区10
期刊
当今社会,经济的高速发展带来各种矿藏资源的极大消耗,由此引发的资源危机已经引起各国的高度重视,我国作为一个世界大国,这一问题显得更为突出。提高探测技术,开发更多的资源储备
学位
细胞色素P450(CytochromeP450/CYP)包含了一个色素蛋白的超家族,在各种生物的异生物质包括药物、杀虫剂,各种污染物,自然界中的毒素以及各种生物内源物质如维生素,甾类激素等的代