论文部分内容阅读
近年来,语音识别技术不断发展并得到广泛应用,具有语音识别功能的设备正在走进千家万户,成为方便人们工作和生活的得力助力。语音信号处理技术的不断成熟和集成电路设计方法的更新,让语音识别技术有了一个全新的开发平台,语音识别芯片和基于FPGA的语音识别技术应运而生。本文系统讲述了人类的听觉系统和语音信号的产生模型,运用数字信号处理的相关理论,讲述了语音信号的预滤波、预加重、端点检测、分帧加窗,并在时域和频域上,分析了语音信号,并将时域的语音信号转换到频域上,提取出语音信号的特征参数。本文讲述了LPC线性预测特征参数提取算法、基于MEL频率的MFCC特征参数提取算法和基于上升过零率的ZCPA特征参数提取算法。用语音信号的特征参数训练出语音信号的系统模型,将语音样本和语音信号的模型相匹配,得到语音识别结果。常见的模型匹配算法有基于动态规划的DTW算法,基于统计的隐马尔可夫模型等等,本文使用MFCC特征参数提取方式和连续混合的隐马尔可夫模型。本文对语音识别的算法进行了简化和优化,分析比较了泰勒展开、半连续隐马尔可夫模型和取指数最大值三种方法来简化语音识别算法,并在MATLAB上模拟了算法在每一种简化方法后的实际效果,结果表明取指数最大值的方法对系统识别率的影响最小,因此,本文采用了取指数最大值的方法来简化系统。同时,本文模拟并简化了协方差矩阵的计算,使得在不影响系统性能的情况下,减少了系统运算量。本文使用FPGA为载体,用IP核构成SOPC语音识别系统。SOPC系统运用模块化的硬件系统设计方式,除硬件加速模块及其控制模块自主开发外,其余模块采用软件实现或者使用Xilinx开发工具提供的IP,硬件加速IP采用自顶向下的设计方式,提供多路运算部件并行运算和使用流水线技术,加快了数据运算,使得只需一个运算周期就得到一个运算结果。研究结果表明,用基于FPGA和硬件加速IP实现的SOPC语音识别系统能够用硬件快速完成系统中复杂算法的运算任务,既满足了语音识别的功能需要,又降低了系统的研发成本,是语音识别技术应用的一个新的方向。