论文部分内容阅读
在信息现代化的今天,计算机的发展极大地影响了我们的学习和生活。如何实现自然和谐的人机交互,已成为当前十分热门的研究课题。 情感计算能使计算机像人类一样感知情感,是人机交互领域研究的重点,对于改善传统方式也具有深远的影响。要使计算机能够与人进行自然、和谐的交互,首先必须使它能够感知人类的情感。作为人与人之间交流的基本方式之一,语音传递着人的情感信息。随着语音情感不断的深入研究,语音情感识别技术已应用到工作、学习、生活等诸多方面。 现阶段的语音情感识别系统大多是基于语料库的统计学习实现的,但是目前国际上并无权威统一的情感语料库。情感语料库是每个系统的基石,实验中大量已标记的数据为实现系统更好的性能做出了贡献。然而,标记大量的样本代价昂贵且耗时,因为它要求人工进行大量的注释。恰恰相反,未标记样本往往是充足的。 本文基于半监督学习Co-training算法思想,将特征集划分为语音信号的时间特征集合和统计特征集合,利用HMM和多类SVM分类器对未标记样本进行标记,选择出标记预测结果相同的样本添加到已标注训练集继续进行训练,来降低对代价昂贵的已标记数据的需求。本文采用中科院自动化所的汉语情感语料库。实验结果表明,本文所实现的语音情感识别系统在平均精度方面,与基于监督学习的方法相比女性库高出9%,男性库高出7.4%。同时,增强协同训练算法可以降低在半监督学习过程中由于错误标记所产生的分类噪声,在这方面达到了与协同训练原型相当的性能。