连续语音识别系统的研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户：z284769

【摘要】

：

语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是让机器听懂人类的语言。经过半个多世纪的发展,随着ASR技术研究的不断突破,其对计算机发展

【作者】

：

鲁泽茹

【出处】

：

浙江工业大学

【发表日期】

：

2016年期

【关键词】

：

语音识别隐马尔科夫模型高斯混合模型深度神经网络 HTK

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是让机器听懂人类的语言。经过半个多世纪的发展,随着ASR技术研究的不断突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如语音拨号、语音文档检索、语音聊天助手,同声翻译、智能家居、医疗服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和各个方面。近些年来,随着Siri的走红,类似Siri、搜狗语音助手这样利用语音实现控制,语义理解的系统开始大量涌现。而ASR作为这类系统的入口,很大程度上决定了这类应用的质量。没有一个好的语音识别系统做支撑,再好的助手也只能是个摆设。所以ASR作为实现人机自由交互的关键技术是非常值得我们深入研究的。本文主要分析研究隐马尔科夫模型(Hidden Markov Model,HMM)原理和深度神经网络(Deep Neural Network,DNN)原理在语音识别中的应用,并以HMM工具包(HMM Tools Kit,HTK)为平台,搭建一个IP语音拨号识别系统。本文所做的工作与贡献总结如下:1.概述语音识别的研究背景与意义以及国内外发展现状。介绍语音信号的预处理,深入研究语音识别中涉及到的关键技术。2.制作语音数据库。编写脚本生成25个随机文本,每个文本包含50句随机IP格式的英文句子,分配给25人(12男13女)录音,共录制1250句。其中1000句作为训练样本(或称为语料),250句作为测试样本。录音数据全部统一采用windows系统中常用的WAV格式保存。3.在HTK平台上搭建一个IP语音拨号系统,使用录制的1000句语料训练出四种类型的模型,单因素HMM模型,三音素HMM模型,绑定状态三因素HMM模型,以及DNN-HMM模型。分别使用这四种模型测试250句样本,对比它们各自的单词识别率和句子识别率,其中DNN-HMM模型的单词和句子识别率在四种模型中均为最高,说明神经网络模型相对于传统的隐马尔科夫模型而言,对语音的拟合性更强。但DNN-HMM模型属于深度模型,复杂度很高,相同的数据在训练和解码过程均需要较长的时间,所以它对硬件的计算能力有更高的要求。4.IP地址一般由四个字段组成(如210.52.207.2),每段所能表示的十进制数最大不超过255。根据IP地址的这一特点,制作语言模型,在语音识别过程中,加入该语言模型,训练出的四种模型识别250句测试语料的句子识别率均有大幅度提高,说明根据语音识别系统的识别任务,构建合适的语言模型可以有效地改善语音识别系统性能。

其他文献

庭院深深深几许?——中日古典庭园建筑的审美文化差异比较

中日两国虽然是一衣带水的邦国,但文化的差异也体现在方方面面,其中古典庭园建筑所体现的差异也是其重要的方面.本文通过中日古典庭园建筑的表现特征旨在揭示两国庭园建筑中

期刊

中日古典庭园审美文化差异

拨开历史的迷雾——近年来张资平研究综述

张资平是20世纪20年代有影响的作家,但对他的研究一直处于不景气的状态.造成这种状态的原因主要是观念上囿于历史定评,研究方法单一.文章探讨了张资平研究的现状,认为应该以

期刊

张资平历史定评研究方法

超光滑高精度微晶玻璃的平面抛光工艺

介绍了一种新型的定偏心式的锡磨盘的超精密平面抛光工艺。在建立了平面材料去除和抛光轨迹的数学模型的基础上，对微晶玻璃进行工艺实验。通过调整影响其精度的工艺装备及工艺

期刊

超精密加工微晶玻璃锡磨盘平面度粗糙度

略论韩愈、柳宗元、刘禹锡的友谊和分歧

<正> 韩愈、柳宗元、刘禹锡都是唐代中叶著名的文学家、哲学家和政治家.他们在文学上,推行古文运动,反对四文骈体;在哲学上,韩愈极力维护儒学思想,反对佛教、道教,对天命有时

期刊

刘禹锡段秀实柳宗元

“沉”入探究 “浮”出素养——谈如何提高小学科学实验的有效性

小学科学课程注重培养学生的科学素养,科学实验是小学科学课程的重要组成部分。怎样提高小学科学实验的有效性,怎样借助科学实验加强学生的科学素养,是科学教师需要深入思考

期刊

小学科学科学实验探究素养有效性

人民中心论:社会主要矛盾转化的必然逻辑

坚持"以人民为中心"的发展思想,明确新时代我国社会主要矛盾发生转化,是习近平新时代中国特色社会主义思想八个明确核心要义之一。精准把握"以人民为中心"作为新时代社会主要

期刊

人民为中心社会主要矛盾三重逻辑

耐辐射球菌细胞内锰离子水平调控相关蛋白研究

细菌细胞内的金属离子动态平衡与细胞的生理生长具有密切关系,许多过渡价态金属离子,包括Mn(Ⅱ)、Zn(Ⅱ)、Ca(Ⅱ)等,不但可以作为蛋白的辅因子参与细胞的多种氧化还原反应,还

学位

耐辐射球菌通道蛋白MntEMntHMntRDtxR

超声辅助乙醇提取桃花中绿原酸工艺的优化

采用超声辅助乙醇提取桃花中的绿原酸,研究超声功率、料液比、乙醇浓度、超声时间对绿原酸提取率的影响。结果表明,最佳提取工艺条件是:超声功率70 W,料液比1∶20 g/m L,乙醇

期刊

桃花绿原酸提取工艺乙醇超声

《匈奴歌》新解

过去对《匈奴歌》的阐释失之于牵强附会。“焉支”与“阏氏”同音同义。“祁连”、“焉支”均为匈奴语的译音。“祁连”“象天单于然” ,那么“焉支”就“象地阏氏然”。匈奴

期刊

匈奴歌祁连焉支燕支胭脂阏氏单于

机制砂在某高速铁路高性能混凝土中的应用

修建某高速铁路需要高性能混凝土。由于该地天然砂短缺,按就地取材原则,使用机制砂;采用粉煤灰、矿粉、聚羧酸高效减水剂"三掺"技术,优化混凝土配合比,所配制的高性能混凝土

期刊

机制砂桥梁工程高性能混凝土应用

连续语音识别系统的研究与实现

其他学术论文