论文部分内容阅读
基于网络的外语学习平台是目前网络技术研究的热点之一,它将改变现有的外语学习环境和教学模式,极大地提高外语学习效率。现有的外语学习平台只能在客观题上给学生标准答案,而无法在主观题(如口语训练)上给学生客观评价。声音处理和识别一直是现有平台的瓶颈,使得网络外语学习平台的实现不够个性化和智能化。本论文的创新点就是结合语音处理技术和神经网络技术来实现计算机对口语训练成绩的客观评价,并以此作为人的主观评价的补充,实现机器客观评价。
本论文重点研究了口语训练语音波形、语音增强、语音特征参数的分析和提取以及基于神经网络模型对口语训练成绩客观评价的方法,其具体内容如下:
1、介绍了网络外语学习平台设计的目标,在对其功能进行分析的基础上提出了一些新的功能:系统组卷、学习监督、口语训练反馈,并详细介绍了这些功能的实现。
2、分析了语音信号增强的基本原理,同时研究了基于小波变换算法、最小均方误差估计法(MMSE)及改进的MMSE方法。通过输出信噪比(SNR)、均方误差(MSE)及语谱图三种客观评价指标对以上三种语音增强方法的效果进行评价,得出改进的MMSE方法是最有效的语音增强方法。
3.研究了与口语训练相关的语音特征参数:有效语音段、短时能量、平均幅度、基音频率、第一共振峰、Mel频率倒谱系数(MFCC)的选择及各自的特征,分析了语音特征参数与口语训练成绩的相关性及其具体提取算法。
4、研究了BP神经网络及Elman神经网络的一般模型、学习规则及基本特征。讨论了隐层神经元个数及训练函数的选取,设计训练网络,计算出待测语音的特征参数并进行大量的防真实验,给出测评的结果及其分析。实验表明神经网络能对口语训练成绩进行客观评价,并且Elman神经网络评价方法较BP神经网络评价方法更优。
本论文创造性地提出了口语训练客观评价的思想,很好地弥补了网络外语学习平台的不足。实践证明,口语训练客观评价能很好地逼近人的主观评价,完全可以满足学生在口语训练及口语考试中成绩的实时反馈,对促进学生外语口语水平及综合应用能力提高具有积极的现实意义。