多模态音乐情感识别技术研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:zth123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的音乐情感识别是近年来在音乐信息检索领域新兴起的重要研究课题之一。它的提出是为了解决不断增长的海量数字音乐的管理问题以及人们多样化的音乐检索需求问题。基于有监督机器学习的音乐情感识别研究的基础是构建带情感标记的样本音乐集,但音乐情感标注是一个既昂贵又耗时的过程,且相对于互联网上海量的音乐数据,人工能标注的数据实在是少之又少。因此,研究如何在少量的带标注数据之上,充分利用海量的未标注数据改善情感识别效果就显得非常重要了。本文将尝试从这一角度对音乐情感识别进行研究。   本文提出并实现了两种结合已标注数据与未标注数据进行音乐情感识别的方法。   方法一结合了无监督机器学习与有监督机器学习,根据歌词进行情感识别。无监督学习采用隐狄利克雷分配模型(LDA)。本文首先在大约30,000首不带情感标记的歌词数据集上训练得到一个LDA模型,然后用此模型对带情感标记的样本歌词(即有监督机器学习模型的训练、测试样本)进行统计推断,获得其主题分布等信息。在此基础上,本文尝试了:   1)基于主题分布特征的情感识别;   2)主题分布特征与N-Gram特征相融合的情感识别   3)两种基于主题信息的情感识别集成算法:基于样本集划分的集成算法和基于特征集划分的集成算法。   实验结果表明,主题分布信息能有效提高歌词的情感识别效果。   方法二使用半监督机器学习模型并利用音乐的多模态性进行音乐情感识别。针对音乐的音频信号、歌词以及MIDI等三种模态数据,本文提出一种以协同训练为基本框架,各模态分别使用“弱学习器”进行学习,再通过Adaboost算法将其整合的情感识别算法。实验结果显示,Adaboost集成过程与协同训练过程均能不同程度的提高情感识别效果。
其他文献
无线视频传感网在传统的以传感器网络为基础的环境监测活动中引入了图像、视频等媒体,信息含量丰富,为实现细粒度、多维度、更全面的环境信息感知提供了数据支持。它关注于视
无线传感器网络越来越多地被运用到环境监测、公共医疗、军事等领域,于此同时,学术界关于物联网的研究也越来越广泛和深入。网络经常被部署在无人值守的恶劣环境中或者敌对环
随着进化算法在多目标优化问题的成功应用,逐步发展成为一个新的研究方向,引起了众多研究学者的重视,成为学术界研究的热点。特别是在过去十年中,众多国内外学者的关注和研究
聚类分析作为数据挖掘的主要方法之一,越来越引起人们的重视。所谓聚类是将一组对象分成若干类,使得同一类内的对象尽量相似,不同类的对象尽量相异。由于聚类在现实生活中应
随着互联网的高速发展,语义网数据的规模也在呈现爆炸式增长。当语义网数据规模达到一定程度时,传统的单机管理模式就无法适用了,在存储和查询的时候,单机的硬件条件必然会成
近几年,随着社会的发展,公共安全已经越来越受到社会的关注和国家的重视。其中公共安全中一个重要的控制因素就是客流量,利用统计的客流量信息,管理人员可以合理的调度人力、
作为构件的运行支撑平台(Component Operating Platform),应用服务器为网络应用的开发、部署与运行提供了全方位的支持,同时通过凝练和提取一系列公共服务支持复用,降低应用开发
汉语是典型的意合型语言,其研究的困难程度举世公认。相对于现代汉语而言,历时性是古汉语的突出特点。这种历时性加剧了数据不同分布和稀疏问题,使得古汉语信息处理研究进展缓慢
WAP技术的发展使手持设备也可方便地访问网络资源,但单独为这些设备开发适合其访问的网页需要投入多余的资源,开发出的网页也因为设备多样性的问题难以适应所有设备的显示。面
随着Web2.0技术的发展,用户越来越注重在互联网上交流和反馈,于是大量的评论和评价信息随之出现。这些用户生成内容,一方面可以提高读者体验,另一方面又可以用来追踪事件发展