语音信号可视化的方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:boyzhxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人与人之间最自然,最直接的沟通方式,特别在思想疏通和情感交流方面,语言交流是最有效率的。然而,对于听力障碍者,尤其是先天性和儿童听力障碍者,听觉功能丧失导致他们无法与普通人进行语言交流,虽然有电子听力辅助设备和手语的存在,但是由于各自的局限性,无法广泛地应用,久而久之,这些听力障碍者会感到被社会所孤立。所以,本文以语音信号可视化技术为背景,设计一个面向所有听力障碍者,尤其是先天性和儿童听力障碍者的听力补偿系统,利用功能正常的视觉代替听觉,使他们通过训练后能够理解图像所代表的语音内容,让这些听力障碍者可以“看”见声音。论文针对先天性和儿童听力障碍者学习能力偏弱的情况,使用基于声母和韵母的语音识别技术,建立可视化的听觉补偿系统。传统语音识别技术以汉字为单位,而学习能力较弱的先天性和儿童听力障碍者无法学习数量庞大的汉字,所以本文创新性地使用数量少,简单易学的声母和韵母代替汉字作为听觉补偿系统中的识别和显示单元,并利用色彩编码技术为听力障碍者呈现更多的语音细节。本文主要工作包括以下四个部分:(1)研究声母和韵母的分割算法。汉语音节除少数单韵母音节外,全部由声母和韵母构成,在进行基于声母和韵母的语音识别前,必须先将音节中的声母和韵母分割开。本文采用主体-延伸基音检测法,实现声母和韵母的分割。(2)建立听力补偿系统的识别模块。本文引入声母预选机制,提高声母识别的准确率,然后改进DTW算法,使其能够在低信噪比环境下具有更好的适应性,对声母和韵母进行识别。经过验证,改进后的算法对韵母有较高的识别率,声母稍差,但是总体上能够达到实验要求。(3)引入色彩编码技术。语言交流不仅包含文字内容,还包括说话者的情绪,节奏快慢,音响等语音细节。利用色彩编码技术,使不同的声母和韵母呈现对应的颜色,让听力障碍者在看到颜色后,不仅能够通过辨识出的声母和韵母了解语音的内容,还可以通过色彩的形状获得语音的细节。(4)最后,基于MATLAB平台设计听力补偿系统,实现上述功能,经过实验,系统可以良好运行,能够达到听觉补偿的目的。
其他文献
阿尔茨海默症是一种神经系统退行性疾病,目前临床上还没有能够治愈该病的有效药物。以microRNA(miRNA)为靶点的小分子药物是近年来提出的一种新型的用于治疗人类疾病的策略。本
学位
学位
花,与生俱来的颜色、姿态和模样刺激着每一个人的脑神经,让每一个人由衷地愉悦.寻一个人少的时间,和朋友们去附近花市买花,不仅仅为了装饰居室,更重要是取悦自己,而拍下她手
期刊
在实践高效语文课堂的教学过程中,成功的导入课就像魔法一样,影响着整堂课的教学和教学效果.导入语精妙,能深入学生的心灵,合理运用教学媒体资源,给导课锦上添花.
学位
实时PCR是一种最重要的生物技术,广泛应用于分子生物学的基础研究和临床医学的病毒检测。当前,国内外的研究机构都致力于实时PCR仪中应用软件的完善和小型化研发。本文在Window
为了探讨碱性磷酸酶(AKP)与生物瓣钙化的关系,作者对寄主和移植物两方面的因素进行了研究:1)寄主的全身性因素(血液生化分析);2)生物瓣组织在植入体内的变化组织学和超微结构
在科学发展给人类带来极大便利的21世纪,视觉残疾患者和盲人由于视觉受损,不能通过视觉感知世界以充分享受美好的生活,视觉疾患给有关家庭带来的不只是生活的艰辛更是心灵的