安多藏族大学生普通话习得偏误检测方法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:blue1234sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音信号处理技术的日益完善,藏语语音识别、合成技术取得了长足地进步,这对藏语使用者来说受益匪浅。近年来,随着藏区经济不断发展和地区间的文化交流不断深入,藏族人对普通话的学习需求越来越大。在这种背景下,有效的帮助藏语语者学习普通话就显得尤为重要。安多方言作为藏语的一种方言,它的特点是没有声调,而普通话则是一种声调语言。所以,母语为藏语安多方言的藏族人在学习普通话时存在困难。本文以母语为藏族安多方言的在校大学生说普通话的语料为研究对象,以声调偏误和音素偏误为研究内容,结合实验语音学和深度学习,对检测声调和音素偏误的方法进行了重点研究。具体工作如下:1.语料库的设计和建立。本文语料库包括标准普通话语料库和安多藏族大学生说普通话语料库。标准普通话语料库主要由单字调、双字调标准普通话构成。安多藏族大学生说普通话语料库由1280个单字调、2560个双字调以及1280个句子三部分组成。2.声调偏误检测。本文声调偏误检测由两部分构成:听辨实验、相似度检测实验。在听辨实验中,对安多藏族大学生说普通话语料库中所有语音进行听辨,判断其是否发生偏误,并对听辨结果进行统计分析。在相似度检测实验中,首先用单字调和双字调标准普通话语料各自求基频曲线相似度,求得平均值作为检测阈值。再对标准普通话语料和安多藏族大学生说普通话语料的基频曲线计算相似度,根据检测阈值确定是否发生偏误,得出检测结果。最后对听辨实验结果和相似度检测结果做复合评价,计算检测准确率。结果表明,采用相似度对声调进行偏误检测时,单字调检测效果较好。3.音素偏误检测。本文在不同的声学模型下,运用两种不同的声学特征对音素偏误进行检测。将thchs30语料作为训练数据,1280句安多藏族大学生说普通话语料作为测试数据进行实验。在DNN-HMM和GMM-HMM下,使用不同的声学特征对音素偏误进行检测,将结果与听辨结果结合,计算复合评价。实验结果表明,在DNN-HMM下,将MFCC作为输入特征,有较高的检测准确率。
其他文献
随着机器人技术的发展以及通信网络的广泛应用,近年来,随机系统在各个领域的应用愈加广泛。多智能体系统是当今研究方向中的一个热点,在网络数据的传输过程中,通信限制、时间
在CBA联赛中,裁判员的管理始终是外界关注的焦点。CBA公司成立后,裁判员管理相关机构也逐渐完善。针对裁判员,CBA公司制定了更为全面的规章制度,因此对联赛裁判员有了更为规
医学图像配准旨在寻找某种空间变换使得两幅医学图像建立解剖对应关系,医学图像配准在病灶定位、疾病诊断、手术导航、放射治疗等领域发挥着极其重要的作用,实现高精度、高效
随着无线通信、嵌入式计算技术、传感器技术、微机电技术的不断发展,无线传感器网络(Wireless Sensor Network,简称为WSN)改变了人类与自然界的交互方式,在军事、环境监测、
外骨骼作为一种新兴的可穿戴机器人,在对人体的进行保护的同时,辅助人体运动、肌肉神经康复以及协助人类完成各种艰难苛刻的任务。尤其在康复外骨骼的应用中,坐起运动是康复
香农的多天线系统遍历容量在先前的研究中得到了广泛的分析,然而,对于下一代无线网络,它并不能解释一些新兴的实时应用的服务质量(Quality of Service,QoS)需求。例如,移动视
随着信息技术的不断发展,用于识别或身份验证的生物特征识别系统被广泛应用,这些系统有着不容易丢失或遗忘等优点,并且还能提供良好的识别准确性。然而,基于生物特征的身份识
弹性光网络(Elastic Optical Network,EON)采用正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术,具有灵活的频谱分配方式和支持多速率传输等诸多优点,被
由于儿童的大脑发育不完全,麻醉药物引起的神经振荡变化与成人不同,所以面向成人的麻醉深度算法与监测仪器无法应用于儿童的全麻手术监测。对不同年龄患者在全麻手术中的脑电
蓄电池在工业运输、5G通信、电动汽车等领域应用广泛,但随着行业技术的突破性进展,各领域对其提出了更加多样化的要求。电池荷电状态(state of charge,SOC)是电池使用状态的