论文部分内容阅读
在语音信号识别领域,语音信号端点检测技术十分关键。端点检测的目的就是确定出语音信号的采样起始点和结束点位置,使系统对语音信号的处理可以降低功耗、提高系统性能。如今端点检测技术的应用十分广泛,比如在语音会话工具、可穿戴设备、人工智能机等诸多地方都有着应用。近几年来,出现了许多实用高效的端点检测算法,大致可将这些算法分成两大类,一类是基于数字信号频域或时域提取特征参数的算法,而另一类是基于模式匹配的各种算法。目前,语音信号端点检测技术研究在无噪声干扰情况下已经十分成熟,但是在低信噪比时检测效果将会显著下降,所以对低信噪比时寻求准确高效的检测算法仍然十分关键。论文首先对传统的基于时域频域特征参数的算法进行了综述,通过对其在不同噪声强度下的检测性能评估可以得出,在无噪声干扰时传统检测算法检测正确率很高,具有计算量小效率高等特点。但对于低信噪比环境,传统算法检测性能迅速降低,无法准确找出信号边界点的位置。因此针对于低信噪比环境,可以首先采用语音信号去噪算法对带噪信号进行去噪,再对去噪后的信号进行端点检测。基于这一思想,本文提出了增强减谱方差联合法以及多窗谱减谱能熵比联合法,这两种算法将语音信号的去噪与检测处理有效结合在一起,达到提高检测结果正确性的目的。本文提出的增强减谱方差联合法的检测原理就是先利用增强减谱法对带噪信号去噪,增强减谱法引入了减谱调节因子,让减谱法在原有的基础上对噪声的适应性更好,经由增强减谱法去噪后的信号的方差值在语音信号边界点处特征明显,因此接着采用基本方差法进行端点检测。多窗谱减谱能熵比联合法是利用多窗谱估计减谱法对带噪语音信号进行去噪,多窗谱减谱法采用多个相互正交的窗函数求谱值,这样可有效减小实验误差。而能熵比法相较于其它的传统端点检测算法的抗噪声性能更强。为了验证本文提出的两种新算法的性能和特性,将这两种新算法运用到音频识别中进行实验分析,本文实验所采用的纯净语音数据是自然人声语音数据集,噪声信号数据所采用的是Noisex-92噪音数据集。将几种加性噪声信号分别叠加在纯净语音信号上,即可得到实验所需的带噪语音信号数据集。通过设置不同的信噪比以及加入不同类型的噪声,观察其检测结果并进行对比分析。依据实验结果进行分析能够得出,本文提出的两种新算法对不同噪声和低信噪环境适应性良好,可以将语音信号的边界点有效检测出来。