基于HMM小字符集语音识别的研究及应用

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:kyy06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与机器进行语音交流,让机器明白人类说什么,这一直是人们梦寐以求的事情。语音识别的目的就是让机器听懂人类口述的语言,听懂就是机器通过识别和理解过程将人类的口述语言转化为相应的书面语言并能对其所包含的要求、命令作出正确的反应。 语音识别技术是一门多学科交叉的新兴学科技术,它涉及到声学、语音学、生理学、统计学和模式识别理论、信息理论与计算机学科、应用心理学、数字信号处理技术等多个学科领域的研究。语音识别技术经过近半个世纪的发展,己日趋成熟,内容也越来越丰富,然而无论人们在为让机器听懂并理解人类语言方面花了多少努力,人们距离让机器能够理解任何人口述任何内容的目标还很远。语音识别技术的产品已经走入了各行各业,比如在金融、商业、工业、文化、教育等领域已经体现出了其强大的应用前景。各种语音查询处理、语音控制产品在不同程度上改变着人类的生活方式。语音识别分类广泛,与连续自然语音识别的应用难度不同,以孤立词识别为基础的语音指令识别系统已经开始走向实用化。 本文正是基于对语音识别的强大应用背景的吸引及其实用性,就简单的非特定人孤立词语音指令识别系统的基本原理与方法进行了详细的分析和讨论,并对HMM建模的语音识别的具体应用的技术细节进行探讨,希望能在此领域有所贡献。 本文介绍了语音识别的发展历史与研究现状,对语音识别的定义、原理、系统的分类进行了概述,然后针对语音的声学模型和语言模型,语音信号在时域和频域上的分析,如先要将语音信号数字化,然后对此数据进行预处理、分帧,加窗,再通过双门限法进行端点检测,并提取系统的MFCC特征参数等方面的做了详细的介绍和各种方法的比较。接着重点介绍了HMM的定义及其研究中的三个问题和相应的解决方法的算法,如前向-后向算法、Viterbi算法和Baum-Welch算法也进行了说明,对HMM在应用时的结构选择和训练准则进行了探讨。然后给出了一个基于HMM的小字符集的孤立词语音识别系统的初步实现,在Windows平台上仿真和编写了预处理、端点检测、特征参数提取、语音模板训练、隐马尔可夫模型识别程序模块,实现了语音识别的各个过程,并给出一个简单的孤立词识别系统的应用。此系统最后的结果是对同定词汇表中的词汇进行模式匹配,匹配成功则提示正确,否则提示输入错误的信息,以这个作为结果输出。
其他文献
随着社会的不断发展,不同文化背景、不同语言习惯的人们在文化,经贸等各个领域的交流日渐频繁,语言障碍成为人们交流过程中遇到的主要障碍。统计机器翻译(Statistical Machine T
随着通讯技术的发展,网络中的同一信息可能保存在不同的网络设备中,当修改一网络设备中的信息时,另一网络设备中的相同信息也应做相应的改变,这就引入了同一信息在不同网络设备中
地理信息系统(GIS)为房地产数据的获取、存贮、分析、处理提供了强有力的工具和先进的技术手段,国内外许多房政管理部门都建立了各自的房地产地理信息系统(REGIS)。目前,GIS在
球面点的分布问题,是世界性数学难题。球面点分布问题有许多不同的求解目标,可以分为最优球面覆盖问题,α-能量最小问题,球面等面积划分等问题,这些不同的求解目标分别对应着不同
随着计算机技术、网络技术、控制技术和通讯技术的发展,计算机网络系统已泛应用在通讯、工业生产、建筑、医疗、办公、消防、环保等领域。构建一个先进、实刚、安全、可靠的计
本文在综合分析我国土壤养分管理研究现状和WebGIS实现方法基础上,深入研究了:WebGIS的体系结构、实现技术;ASP.NET(Active Sewer Pages)技术及其在Web开发中的应用;Javascript技
客户关系管理(CRM)是一种先进的管理理念,要求企业以客户为导向,整合内外流程,持续改进对客户的服务水平。CRM也是一种管理软件和技术,它将最佳的商业实践与数据挖掘、数据仓库、
本文研究和实现了一个图形化流程编辑器原型。在文中,首先,根据流程的定义,提出了自己对流程定义的理解并提出了一个流程模型。其次,研究和讨论了流程图的基本元素,并提出其元素的
随着人们对网络应用和服务的高效性、可用性和可靠性等诸多性能的要求不断提高,从网络管理的角度对网络服务的运行状况进行实时监控管理,是保障网络高效运行的重要环节。本课题
经过十几年的研究和实践,数据挖掘技术已经吸收了许多学科的最新研究成果,而形成独具特色的结构分支。其中,聚类算法作为数据挖掘工具集中的一个模块,具有广泛的应用价值。典型的