论文部分内容阅读
口语理解是口语对话系统(Spoken Dialog System)的重要组成部分。口语理解模块旨在从用户的语句中提取语义信息,即识别出输入语句的意图,并抽取出相应的语义槽概念。通常这个任务可以分解为两个子任务:关键语义概念识别和意图识别。关键语义概念识别的目标是确定任务领域相关的语义概念;意图识别的目标是确定输入语句的主题或者动作。 本论文针对口语理解任务面临的一系列挑战,从多方面展开研究,主要的工作和创新点如下: (1)针对中文口语理解的两个子任务分别进行了深入研究。关键语义概念识别部分,使用条件随机场的方法进行建模。通过对任务领域的分析,抽取了两大类特征:语义概念前后的指界词特征和人名的常用字特征。实验结果表明,相比字及上下文特征,这些特征可以使F1值在三个测试集上有不同程度的提升。意图识别部分,使用了支持向量机。通过对意图识别特征的分析,提出一种新的特征提取方法。该方法首先统计训练语料中的字频和词频,然后依据领域知识筛选字词特征,最后结合关键语义概念识别得到的语义类特征作为最终的意图识别特征。实验结果显示,这种方法与基线系统相比,不仅提高了意图识别的性能,而且还降低了特征的维数。 (2)对口语理解两个子任务的组合方式进行了研究。首先,研究了并联型和级联型两种组合方式;然后,在此基础上提出联合型结构进行中文口语理解,即通过三角链条件随机场对意图以及关键语义概念共同建模,用一个单独的图模型结构共同表示它们的依赖关系。通过实验发现:该模型可以将两个任务一次完成,在关键语义概念识别上性能优于其它的组合方式。 (3)提出利用语义概念规整提高口语理解鲁棒性的方法。针对用户输入语句经常出现关键语义概念变异,以及不同类语义概念具有相同上下文的情况,提出一种新的鲁棒性的口语理解框架。该方法主要对关键语义概念识别部分进行改进。在语音识别文本上进行的实验表明,对于语义类标注,该方法得到的最好结果与基线性能相比,可以使F1值从42.68%提高到82.82%;对于意图识别,识别错误率从基线系统的6.6%下降到4.66%。 (4)标注数据的获取是口语理解系统开发初期需要面临的一个难题。本文研究了口语理解的弱监督训练方法,包括主动学习和半监督学习方法,以及将主动学习和半监督结合起来的方法。根据本文的口语理解框架提出使用协同训练进行意图识别的方法。实验结果表明:在两类意图识别任务方面,结合主动学习和半监督学习的方法比单纯使用主动学习或者被动学习可以在保证分类性能的前提下,有效的降低人工标注的工作量。协同训练可以通过少量标注数据得到的两个独立特征子集训练的分类器互相提供标注样本,达到自动标注数据的目的。