面向英语口语测试的发音错误检测和诊断技术研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：fox_pop

【摘要】

：

口语发音的自动检错和诊断是计算机辅助语言学习和测试领域的关键技术之一。本文在深入分析现有技术的发展现状和总结前人已有成果的基础上，面向大规模人群口语测试的应用背景

【作者】

：

李宏言

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2011年期

【关键词】

：

发音错误检测发音诊断大人群口语测试分类器模型时长模型支持向量机神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

口语发音的自动检错和诊断是计算机辅助语言学习和测试领域的关键技术之一。本文在深入分析现有技术的发展现状和总结前人已有成果的基础上，面向大规模人群口语测试的应用背景，对口语发音的自动检错和诊断技术进行了系统的研究，其主要贡献和创新点是：　　 1)数据资源是发音评估、检错和诊断技术的研究基础。针对大规模语料数据的挖掘和利用，本文构建了面向发音错误检测和重音错误检测的多个数据集。同时，对发音检错和诊断系统的评价指标体系进行了深入的类比分析，为实验分析和算法比较提供了统一的标准。　　 2)针对发音错误检测中的错读问题，通过对传统的基于HMM框架的后验概率和GOP等方法的分析梳理，本文从假设检验和分类检测的角度出发，将多种分类器方法引入到发音检错领域，并提出了一系列新的发音检错方法，包括基于通用背景模型的高斯混合模型(GMM-UBM)方法、基于广义线性区分序列核的支持向量机(GLDS-SVM)方法、基于TRAP特征的神经网络(TRAP-NN)方法。针对具有线性核函数性质的GLDS-SVM方法，提出了一种基于多模型融合的发音模型训练策略，可以比较有效地解决大数据量条件下的模型训练问题和引入新数据后模型修正的问题。TRAP时频特征的引入提高了对发音质量的刻画精度，在通用型的单一化发音枪错系统中，其对应的TRAP-NN方法取得了最优的性能，对于置换式错误集、故意式错误集和自然式错误集，其等错误率分别达到8.73％、14.17％和28.44％。　　 3)针对发音错误检测中的错读、漏读和添读问题，本文提出了广义发音空间(GPS)的概念，将音素的错读、漏读和添读现象纳入到统一的检错范畴。同时，通过对大规模连续语料的错误发音规律的统计归纳，提出了基于词相关规则网络的发音检错方法，规避了传统的通用规则方法的缺陷，并有利于诊断反馈信息的自动输出，同时也分析了词相关规则方法的局限性。实验表明，在针对特定区域人群的大规模语料的支撑下，相比GOP和分类器方法，基于词相关规则网络的检错方法能够获得更为优异的性能。　　 4)针对发音评估和检错中的时长信息利用问题，提出了基于上下文语境的改进时长置信度，将不同层次语境上下文的时长建模纳入到统一的框架。同时，根据语料的数据量和分布情况，使用回退(Backing-off)策略对时长模型的训练进行自动调整，并采用基于查找表(Look-up table)的离散化策略对时长的直方图分布规律进行建模。实验显示，随着上下文约束的加强，时长置信度对发音评估和错误检测的帮助作用将越显著，而词相关时长模型的效果尤其突出。　　 5)针对英语词重音的错误检测问题，在对元音央化(Vowel Centralization)和重音表象的分析基础上，提出了多种基于谱特征和分类器方法的了元音品质分数，成为传统韵律特征的有益补充。同时，提出一种基于分组策略的重音模型训练方法，可以缓解重音和非重音样本分布不均衡的问题。提出一种基于发音变化网络的方法，提高了动-名词埘(noun-verb stress pairs)词汇的重音指派位置错误的检测性能。实验表明，融合了多种策略的重音检错系统在专项测试集上的等错误率达到10.19％。

其他文献

多级轴流压气机三维数值模拟及失稳控制

压气机在当前社会生产生活中起着越来越大的重要作用,而其稳定运行则是该作用得到保证的关键。为了更好的控制压气机的稳定运行,必须更好的了解压气机的工作特性。在该问题上

学位

轴流压气机三维数值模拟失稳控制

北京三环快速路匝道控制研究

交通作为城市经济活动的命脉,对城市的经济发展、人民的生活水平提高起着至关重要的作用。目前,北京的机动车数量迅猛增长,而道路增长速度和车辆的增长速度严重脱节,这是造成

学位

快速路匝道控制遗传算法最优控制

粒子群算法搜索模式研究与应用

随着生产实践和科学研究的深入,人类面临的优化问题也越来越复杂,传统优化方法已不能在有限开销内找到满意解,所以需要不断的找出更好更快的优化算法来解决问题。粒子群算法(

学位

粒子群算法当前控制域社会粒子群算法无线传感网络覆盖优化

基于多模板回归加权均值漂移的机器人行人跟踪

随着计算机视觉技术与机器人技术的蓬勃发展，服务机器人逐渐走进人们的生活当中。作为实现机器人与人类交互的关键性技术，行人跟随技术受到越来越多研究者的关注。目前在行人目

学位

移动机器人行人跟随纹理特征多模板回归加权均值漂移算法

基于ARM9的电子压力计地面终端设计与实现

试井是油藏工程的重要手段，而其核心是压力试井，因此地层压力测量是石油试井技术中必不可少的工作。目前国内油田多使用电子压力计来实现压力数据的采集、存储和数据浏览的功能

学位

压力试井电子压力计地面终端嵌入式系统

人机交互动态手势识别及其一次学习认知模型研究

作为一种非侵入式的交互接口，基于视觉的动态手势识别可以实现自然、方便的人与机器人交互(Human-robot Interaction，HRI)，简称人机交互。近年来，随着一次学习(One-shot Learning

学位

动态手势识别人机交互一次学习特征提取认知模型

基于探测型AUV的水流测量数据处理方法研究

水下机器人是一种很重要的水下探测调查器，利用水下机器人可在海洋深处直接进行海洋生物、物理、化学和地质等科学考察活动，可以在深海勘测地形、地貌、采集海底样品，支持海洋工

学位

水下机器人拉依达准则卡尔曼滤波平滑滤波阿克码插值水流测量数据处理

基于内容的多媒体信息检索关键技术研究

基于内容的多媒体信息检索是当今多媒体分析和处理领域的一个重要研究方向。它通过计算用户提交的查询实例与数据库中实例的内容相似度，对数据库中的实例进行自动排序，从而使用

学位

多媒体信息检索子空间模型复制视频检测问答系统稀疏编码

基于性能评价的在线PID控制器参数整定软件开发

控制系统性能的优劣直接影响工业生产经济效益的高低,甚至关系着整个工业生产的安全问题。在影响控制系统性能的众多因素中,控制器参数是不可忽略的主要原因。在实际工业过程

学位

工业生产在线PID控制器性能评价参数整定软件开发

协作系统的容错控制

随着现代控制系统的结构越来越复杂,对其各部件的可靠性、准确性的要求也越来越高,从而出现了故障诊断与容错控制技术,并且在航空、航天、机器人、工业过程等领域已经取得了

学位

随机分布系统协作系统故障诊断协作容错控制鲁棒性分析

面向英语口语测试的发音错误检测和诊断技术研究

其他学术论文