论文部分内容阅读
韵律是语音中的超音段特征,它能够促进和增补语义、语用等信息的表达,因而在口语交流中起着非常重要的作用,自然也成为语音语言科学研究和言语工程的一个重要组成部分。以往的韵律研究多侧重在节奏层级的划分,鲜有系统全面的汉语重音研究。本文以普通话重音为研究对象,介绍了重音语料库的建设,汉语重音的层级韵律分析、建模,进而探讨了重音在文本层面的特征,并构建了多个基于文本的重音预测模型。最后,以语音合成应用为例,介绍了重音研究对言语工程的促进作用。
总体而言,本文对该领域的贡献和创新点有:
1、构建了大规模的重音标注语料库,并细致分析了汉语词重音和句重音的韵律表现。研究发现基频对重音的感知影响较大,且不同韵律层级和调型组合会影响词重音的感知,这种感知差异在时长和基频两方面表现不尽相同。在连续语流中,双音节韵律词的重音稳定性较低。最后,本文采用回归分析和决策树分类两种方法对语流中的重音进行了自动检测,该工作有利于将重音研究引入到语音识别中,也有利于快速构建重音标注的语料库。
2、探讨了重音在文本层面的特征,重音与句法的关系,总结了句法到重音的映射关系,并提出了句法到重音的映射模型;同时,采用文本特征利用分类与回归树和最大熵模型构建了多个重音预测模型;另外,以最大熵模型为基准,设计了封装式的特征模板选择方法,提高了最大熵模型的重音预测性能。
3、根据汉语重音的特点,本文主张要加强轻音的研究,并据此提出了新颖的层级重音建模和预测方法:即通过句子与韵律词两个层面刻画重音。根据不同层级的作用,在句重音层级,侧重重音音节的建模分析;而在韵律词重音层级,侧重轻音音节的建模分析。层级重音建模能够兼顾全局和局部的两个层次的韵律特征,同时保证每层模型具有较高的正确率和召回率,使得模型能够可靠地从任意输入的文本得到较为细致的重音等级标注结果。
4、以语音合成为例,介绍了汉语重音在言语工程中的应用。分别在基元选取系统、基于隐马尔科夫模型的统计参数语音合成系统中完成了重音的生成。同时也结合Fujisaki模型的层级基频建模思路,完成了层级重音生成。对这三种合成语音的客观评价和人工听测表明,重音的融入能够明显提高合成语音的表现力和自然度,其中,表现力的提高更为显著。
汉语韵律的研究一直是语音语言科学和言语工程的关键和瓶颈之一。以上对汉语重音的深入系列研究对加深汉语重音的理解、提高语音识别、语音合成、口语对话系统的性能具有一定的意义。本文采用的一些方法不仅对汉语重音研究有帮助,也可以推广到自然语言处理的其它领域,具有一定的普遍意义。