论文部分内容阅读
基于内容的音乐情感识别是近年来在音乐信息检索领域新兴起的重要研究课题之一。它的提出是为了解决不断增长的海量数字音乐的管理问题以及人们多样化的音乐检索需求问题。基于有监督机器学习的音乐情感识别研究的基础是构建带情感标记的样本音乐集,但音乐情感标注是一个既昂贵又耗时的过程,且相对于互联网上海量的音乐数据,人工能标注的数据实在是少之又少。因此,研究如何在少量的带标注数据之上,充分利用海量的未标注数据改善情感识别效果就显得非常重要了。本文将尝试从这一角度对音乐情感识别进行研究。
本文提出并实现了两种结合已标注数据与未标注数据进行音乐情感识别的方法。
方法一结合了无监督机器学习与有监督机器学习,根据歌词进行情感识别。无监督学习采用隐狄利克雷分配模型(LDA)。本文首先在大约30,000首不带情感标记的歌词数据集上训练得到一个LDA模型,然后用此模型对带情感标记的样本歌词(即有监督机器学习模型的训练、测试样本)进行统计推断,获得其主题分布等信息。在此基础上,本文尝试了:
1)基于主题分布特征的情感识别;
2)主题分布特征与N-Gram特征相融合的情感识别
3)两种基于主题信息的情感识别集成算法:基于样本集划分的集成算法和基于特征集划分的集成算法。
实验结果表明,主题分布信息能有效提高歌词的情感识别效果。
方法二使用半监督机器学习模型并利用音乐的多模态性进行音乐情感识别。针对音乐的音频信号、歌词以及MIDI等三种模态数据,本文提出一种以协同训练为基本框架,各模态分别使用“弱学习器”进行学习,再通过Adaboost算法将其整合的情感识别算法。实验结果显示,Adaboost集成过程与协同训练过程均能不同程度的提高情感识别效果。