基于音频的音乐情感识别及其摘要的研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:joinroot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国互联网络信息中心(CNNIC)2010年1月发布的第25次中国互联网络发展状况统计报告指出,在3.84亿网民中,约3.21亿网民使用网络音乐应用,网络音乐以83.5%的使用率高居互联网应用使用率榜首。与此同时,数字音乐的数量也与日俱增。在互联网普及和网络应用不断发展的今天,面对庞大的用户群体和海量规模的数据,数字音乐的检索与推荐的重要性不言而喻。   让用户更快的找到自己感兴趣的音乐,是音乐检索与推荐的主要目的。音乐情感识别能够捕捉到人们对音乐的情感需求,根据音乐情感进行音乐检索和推荐,可以有效改善用户体验,明显提高检索推荐效果,具有很大的应用价值。而对音乐进行智能摘要提取,使音乐摘要能够在很短的时间长度上尽量体现音乐特征,比如音乐的情感信息,可以帮助用户迅速了解音乐情感特征,对提高检索效率、节省用户时间很有帮助。因此,对音乐情感识别和音乐摘要提取技术进行研究,具有重要的现实意义。   在音乐情感识别方面,本文基于PAD情感模型,分别使用多元线性回归、支持向量回归、高斯过程回归三种不同的回归方法,对中文歌曲进行PAD情感值的回归实验,并分析实验结果:提出了一种基于区间预测误差权重的回归器集成方法,并用这种集成回归方法对三种回归器的不同组合做集成实验,实验结果表明,该回归器集成方法能有效、稳定地提高音乐情感识别效果。   在音乐摘要提取方面,本文提出了一种基于片段情感识别的歌曲摘要提取方法,给出了其形式化描述及其中涉及到的问题的解决方案。该摘要提取方法包括根据歌词时间标签的歌曲分段、基于扩展训练集的歌曲片段情感识别、基于模糊聚类的歌曲整体情感识别、摘要提取算法参数确定等关键步骤。实验结果表明,该方法提取的摘要能在PAD情感模型的A、D维度上很好地代表整首音乐的情感。
其他文献
密码技术是实现网络信息安全的核心,除了用于信息加密外,也用于数据信息签名与安全认证,是保护信息安全的最重要工具之一。随着计算机科学技术的发展,网络和信息技术已经渗透到社
学位
随着信息技术不断深入应用到金融、交通、军事、网络监测等领域,面向数据流的应用已经无处不在。而近年来互联网的广泛应用,海量的数据得以涌现。不同于传统的数据流只是一些
歌曲情感识别是音乐信息检索领域中的重要问题之一,本文主要研究并实现了两种歌曲情感识别方法。与已有研究工作不同,本文利用歌词文本信息,分析得到歌曲的情感。   本文
当前,Java系统以其良好的网络移动性、广泛的跨平台能力以及快速开发、快速部署的优势越来越受到开发者的欢迎。其应用领域从最初的服务器和桌面领域扩展到了实时和嵌入式领
近年来,傅立叶变换红外光谱仪(简称FTIR光谱仪)已得到广泛应用,专用的傅立叶变换红外光谱仪一般配备专用的光谱信号实时处理系统,以实现红外光谱信号的实时处理与分析。为了
学位
随着Internet的飞速发展,Web己经发展成为包含多种信息资源、站点分布全球的海量信息服务网络。搜索引擎正是一种帮助用户从信息海洋中找到用户所需要信息的工具。一些通用的
图像编辑是指将图像中的内容呈现进行改变,以更好的满足应用需求。这是当前国际上的一个热点研究内容。目前,这些方面的研究工作很多,但它们大都是在像素层面上进行处理,不便于对
工作流技术作为一个概念最初是出现在图像处理和文档管理领域中,它是业务过程在计算机系统中的表示。随着计算机网络、数据库和分布式对象等相关技术的迅速发展和成熟,工作流
大气光学参数实时测量及管理系统主要完成近地面激光大气传输有关的参数测量,并将测量到的参数发送到上层控制计算机,及对所测量到的数据进行管理。   针对上述情况,论文
学位
软件可靠性是度量软件质量的关键性因素,是软件使用者最为关心的问题之一。准确预测软件可靠性,有利于指导软件测试最大限度地发现软件故障,阻止失效发生,节约开发成本,提高软件质