面向聋儿言语学习的语音交互系统

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:jhh760606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的聋儿言语康复治疗通过特殊言语教师的手势、口型等方式来训练,难度大、效率低而且教师资源缺乏,难以达到国家提出的“人人享有康复服务”的目标。特别是由于高成本的人力资源等经济原因,很多偏远地区的残疾人不能及时得到康复医疗,从而造成终身聋哑。因此我国迫切需要一种数字化教育和学习语言发音的方式,能够让学生观察准确的发音方式,并随时可以接受训练和反馈,提高语言学习和训练的质量。  本项目的研究将致力于利用计算机多媒体信息技术实现一个交互式、可视化、多媒体的语言教学平台,即聋儿言语康复系统与言语康复学习机,目标就是实现低成本、高效率的学习机,适应于聋儿课堂与家庭的学习,帮助聋儿快速学习、训练和应用语言,从而更好地为聋儿言语康复工作做贡献。  本文主要完成了面向聋儿言语康复的语音交互系统的设计与分析,并在此基础上完成了数据采集系统的软件设计。利用matlab编制的程序对聋儿与正常儿童音频数据的时长、响度、音调和清浊音进行测试对比与分析,发现聋儿具有拖音严重、响度较低、音调区分度低且浊音发音欠缺等特殊特征,并通过对这些特征进行可靠性和准确性的分析,设计出一套结合语音检测与语音识别的聋儿言语交互系统。  语音交互系统包含听觉、启音以及情景对话,并利用C#设计系统软件。在启音模块中,详细介绍了各个模块的算法、实现步骤及实现效果。经过测试,由于聋儿的发音水平参差不齐,得出聋儿四声调的整体识别率为67.71%,而清浊音的整体识别率普遍较高,为95.02%。在情景对话中,利用语音识别技术中的非特定人、连续语音识别,得出正常儿童总体识别率为95.95%,而聋儿由于发音状况不稳定,所以总体识别率较低,为77.11%,总体满足聋儿言语学习要求。最后简要介绍了言语康复学习机嵌入式手持设备与骨传导耳机成品图,同时参加了2010年在深圳举办的第十二届中国国际高新技术成果交易会,获得广泛关注。
其他文献
本文以实现适用于无人机的视频压缩算法为目标,从理论研究和工程应用两方面出发,对符合无人机航拍视频序列特点的压缩方案进行了方法研究和仿真试验。近年来,无人机平台技术的不
近红外光谱是一种有竞争力的,非侵入式的用于探测人脑活动的脑成像技术(fNIRS)。它以神经活动与血氧变化的紧密联系为前提来通过测量血氧变化观测人脑的神经活动。对比现代的
学位
片上集成的晶体管数目持续增长,而传统单核处理器的性能发展却难以持续,因为依靠指令级并行获得的收益越来越少,而功耗问题和散热问题也日益凸显出来。多核/众核处理器在单个芯
独立成分分析(Independent Component Analysis,ICA)算法是盲源分离的一种有效手段,是以独立性为约束条件从多维数据中挖掘出其本质结构的一种方法。目前,针对大数据量的ICA处理
随着硬件技术、服务器技术、业务处理需求的发展,网络设备的处理能力得到了大幅提高,并且也得到了越来越广泛的应用。多核网络设备的出现,使得硬件的处理能力得到成倍的增长,
随着Web2.0的兴起与发展,用户的身份也逐渐发生了转变,既是互联网的消费者,同时也成为了互联网内容的构建者。通信领域也因此正在转变传统的服务观念,开始更加重视服务模式的
随着互联网的迅速发展,促进了信息处理和信息交互的技术的研究与应用,其中研究应用的热点之一便是在计算机网络环境下的合作协同计算。合作协同计算不仅发生在合作者之间的,甚至
并行计算是当前计算机技术发展的趋势。随着多核和众核技术的发展,越来越多的软件和应用程序需要使用多线程语言编写。众所周知,并行程序远远比串行程序难编写,非常容易出现各种
学位