论文部分内容阅读
近年来,随着语音识别技术的不断研究和发展,许多语音识别算法已经非常成熟,并出现了一些商用语音识别软件,例如IBM中文语音识别系统ViaVoice。但专用语音识别芯片的研究和开发还较少,这极大影响了语音识别技术的使用和推广。 本文研究内容主要应用于小词汇量、非特定人、孤立词的汉语语音识别芯片。论文研究了矢量量化(VQ)和隐马尔可夫模型(HMM)等语音识别技术的算法和原理,完成了基于离散隐马尔可夫模型(DHMM)的Viterbi算法与矢量量化算法的软件及硬件实现。 论文首先对32、64孤立词语音识别系统,采用了矢量量化法和离散隐马尔可夫模型法进行了定点和浮点的试验比较。在定点实验中,VQ法得到的识别率分别为82.19%和81.26%,离散隐马尔可夫模型法分别取得了98.75%和98.13%的识别率,从而验证了离散隐马尔可夫模型法的优越性。接着,论文提出了改进Viterbi算法,该算法是在求最大路径的基础上,分别求出第二大和第三大路径,然后对第一、第二、和第三大路径进行加权求和。通过实验比较,采用这种算法得到的识别率要比Viterbi识别算法得到的识别率稍高。然后,通过实验确定了量化码本数。对于32、64词孤立语音识别系统,分别进行了定点和浮点实验。通过研究对比,矢量量化码本数选64最适宜。初始码本的选取采用分裂法得到的识别率比随机法得到的高,可见分裂法优于随机法。分析了空胞腔处理对语音识别性能的影响以及码本容量的选取问题。 最后,论文采用Verilog语言设计了VQ模块和Viterbi译码模块,并完成了功能仿真和逻辑综合。VQ模块采用嵌入的DSP软核实现,论文完成了嵌入汇编语言编写,及代码联调。 本文采用离散隐马尔可夫模型,Viterbi算法进行译码,量化码本数为64,初始码本采用分裂法,Viterbi译码模块采用硬件实现,目前已经通过了FPGA验证。