论文部分内容阅读
随着科学技术的飞速发展以及人类生活质量的不断提高,人们对健康的定义更加明确,尤其对喉部疾病及嗓音质量的好坏也更加重视。对嗓音的音质做出准确地评价不仅有利于嗓音疾病的诊疗,同时在艺术嗓音人才的选拔和培养等方面也起着至关重要的作用。目前艺术嗓音的评价方法存在着耗时、费力且主观性强等缺陷。为克服这些缺陷并探究无痛嗓音检查、无损伤化嗓音疾病诊断等技术,本文从信号处理的角度出发对语音信号的处理方法及艺术嗓音客观评价方法进行了深入的研究,利用计算机语音分析技术提取了艺术嗓音信号的基音频率(F0)、第一共振峰频率(F1)、第三共振峰频率(F3),分析了这些参数的基本特征、规律等,并提出了基于人工神经网络的艺术嗓音客观评价的一般处理方法。本论文的主要工作有:(1)对艺术嗓音信号进行预加重、分帧和加窗预处理,提取声学参数F0、F1、F3,并对结果进行分析。(2)分析了声学参数在艺术嗓音客观评价中的作用,结合神经网络,提出基于误差反向传播(Error Back propagation,BP)神经网络和基于学习矢量量化(Learning Vector Quantization,LVQ)神经网络的艺术嗓音客观评价方法。(3)对艺术嗓音进行主观评价,并划分样本类别。用不同声学参数组合分别同两种客观评价方法相结合对艺术嗓音信号进行评价,再将其评价结果与主观评价结果进行比较,讨论客观评价方法的有效性。分析声学参数与神经网络客观评价模型的最佳组合以便更加客观、有效地评价艺术嗓音。通过仿真分析,发现基于声学参数F0、F1、F3的艺术嗓音客观评价方法能够较好地实现艺术嗓音客观评价的功能,其中BP神经网络评价方法的准确率达到85.2%,LVQ神经网络评价方法的准确率达到88.9%。