论文部分内容阅读
在多媒体技术和互联网迅速发展的今天,越来越多的音乐涌现在人们的生活中,随之而来的,面对海量音乐时,人们如何迅速了解音乐的内容,如何迅速从海量音乐中检索音乐,如何高效的管理音乐显得尤为重要。对音乐结构的自动分析是基于内容的音乐检索、音乐数据分析和音乐管理等研究的基础。 目前,学术界对音乐结构的研究几乎都是基于音乐的内容即音频,但由于音乐特征的维数一般较高,造成了基于内容的分析计算量大、分析耗时等问题,本文主要探索从另一个方向,即以歌词文本作为切入点同时结合内容的识别对中文流行歌曲的音乐结构进行分析。文章提出了一套完整的歌词与内容相结合的中文歌曲音乐结构分析新算法,所使用的技术融合了文本信息挖掘,数字信号处理和模式识别等。 在对大量中文流行歌曲的结构特点和歌词特点进行深入研究后,本文首次提出了歌词的结构分段算法:“句截段”算法,由于歌词的分析结果最终要对应到旋律上,因此旋律的相似才是判别歌词相似的标准,单纯的歌词字符串匹配已不能满足要求,所以算法采取歌词词性序列的相似作为句子相似判别的标准,在此基础上,算法的每一步都针对不同的歌词结构,且依次步骤之间又实现了互相的改进和弥补,最终将整首歌词切分为一组结构段的序列;在将歌词结构段映射到旋律上时,由于歌词文本中只记录每句歌词的开始时间,并没有结束时间,所以无人声的结构就被与其相邻的歌词段划分到同一旋律段中,而没有被单独提取出来,因此本文又引入基于内容的有无人声判别,通过训练一个有无人声的分类模型来对歌词结构段的边界进行校正,同时为了提高分类速度和精度,又对音乐特征、最小识别单位选择和后处理等进行了探索,最后实验显示:以节拍为最小识别单位并结合分类结果的加窗校正技术无论在分析时间上还是准确率上都要优于帧,算法中也采取了该有无人声识别方法并最终实现对音乐的结构分段;算法还对音乐结构的语义标注进行了探索,提出了一组语义结构命名规则并实现了对结构段的语义标注和音乐主题提取,最终实验验证了该歌词与内容相结合的音乐结构分析算法的有效性。为了提高算法的实用性,也实现了一个音乐结构分析的初步原型系统。