歌曲检索中噪声去除技术研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:tprgaefe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于哼唱的歌曲检索系统是一个分析处理音频信号的系统。任何信号处理过程都难免受到噪声的干扰。用户输入歌曲检索系统的哼唱信号中夹杂的白噪声、有色噪声、脉冲噪声以及非哼唱旋律的语音噪声,都会对歌曲检索系统的检索结果产生负面影响。哼唱歌曲检索系统输入信号的噪声去除技术涉及到数字信号处理理论、信息论、噪声模型理论、小波理论等相关领域的综合知识,具有相当高的科学研究价值。   增强基于哼唱的歌曲检索系统的抗噪性,无疑可以提高歌曲哼唱系统的鲁棒性,因此噪声去除研究是基于内容的音乐检索研究中的一个重要方面。有关用户哼唱信号和噪声信号表示模型;噪声信号的类型、特征及其分布规律;输入信号中哼唱信号和非哼唱的语音信号分离等问题是基于哼唱的歌曲检索系统输入信号噪声去除的主要组成部分。这些关键技术的研究及解决对于提高歌曲检索系统的抗噪性、鲁棒性以及增强基于哼唱的歌曲检索系统的实用性有着非常重要的现实意义。   本文针对基于哼唱的歌曲检索系统输入信号的噪声去除,进行了以下研究:   (1)研究基于哼唱的歌曲检索系统输入信号中可能含有的噪声类型,从用户输入信号产生、采集、量化等角度分析噪声产生的原因,以及引入噪声的特征。综合声学理论、信息论理论、数字信号采集理论和数字信号处理理论等知识寻找各种噪声的特征及分布规律,有针对性的选取相关噪声去除算法。   (2)为了削弱用户哼唱信号中含有的非用户哼唱的语音噪声,利用频域盲源分离技术(FDBSS)从系统输入信号中分离出用户哼唱旋律信号和非用户哼唱的语音噪声信号,再根据哼唱歌曲旋律信号的能量连续性判断出歌曲检索系统的输入信号。   (3)提出一种改进的基于线性系统增益因子和Teager能量算子的小波多分辨率自适应软阈值去噪算法,用于减弱在用户哼唱过程中引入的中白噪声、有色噪声、脉冲噪声和在消除语音噪声过程中引入的运算噪声。   (4)用实验验证噪声去除算法的性能,通过实验室已开发的歌曲检索系统验证了对歌曲检索系统输入信号的噪声去除有助于提高歌曲检索系统的抗噪性,去噪后提高了系统输入信号的旋律特征提取的准确性,从而提高了基于哼唱的歌曲检索系统的检索准确度。
其他文献
为了追求更高的精度,当前神经网络的研究朝着模型更复杂、训练数据规模更大的方向发展,这导致模型的训练部署更困难、训练时间急剧增长。怎样将大型神经网络模型在多GPU集群环
中文词法分析是中文信息处理的重要基础,汉语是没有自然分割的连续文本,古代汉语更是没有任何边界标志,我们现在所看到的文言文中的标点符号,都是后人为了方便人们阅读而添加的。
随着新兴的人工智能、HPC云、基于NVMe-over-Fabric的分布式存储、实时大数据分析等应用发展,RDMA技术正广泛应用于数据中心。通过传输层的硬件卸载及OS-bypass的数据路径,RDMA
感兴趣区域,ROI(Region Of Interest),一般是指物体的边缘、角点、拐点、纹理较为丰富的区域,而且这部分区域对观察者理解图像的影响较大。基于感兴趣区域的视频压缩优化一直是
近年来,随着移动计算技术和无线通讯技术的快速发展,移动学习作为一种新型的学习模式应运而生。这种能够在任何地点和任何时间利用手持无线通讯设备开展学习的方式满足了人们对
随着无线技术的迅速发展和无线网络应用的不断普及,无线频谱资源的使用日趋频繁,如何有效的解决无线频谱的紧缺的问题是关系到能否突破限制,让无线通信可持续发展的一个关键问题
交通供需不平衡及异常事件频发导致了交通堵塞、能源浪费、环境污染和安全等严峻问题。智能交通系统(ITS)是解决这类问题的重要手段,可以有效的改善交通状况。由于不能对ITS项
传统的三维造型工具适用于精确模型的制作,需要一定的时间才可以掌握。基于自由手绘的草图工具极大地简化了设计,对草图进行模型创建是现阶段计算机图形学方面一个很热的话题,本
随着计算机技术的发展,数据流已经成为数据存在的一种常见形式,被广泛应用到金融、交通、军事等领域。研究人员设计开发了许多集中式数据流管理系统以及分布式数据流管理系统以
近几年来,随着Internet的飞速发展以及IP技术不断成熟,下一代网络NGN(Next Generation Network)和软交换技术为结合电话网和Internet提供了思路,而IP-PBX(PBX over IP)是该技