说话人识别技术研究及其在医院导医平台中的应用

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:hzn_arm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对说话人识别技术在医院导医平台中的应用作了较为深入的研究。作为一种方便实用的基于生物特征的身份确认技术,目前的说话人识别系统对纯净语音已经可以达到很高的识别精度,但在实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因此抗噪声技术的研究是说话人识别系统在医院噪声环境中投入实用的关键。本文首先分析了医院噪声的主要来源和种类,提出了根据噪声的组成成分的不同而将医院噪声分为三个不同的工作时段,并建立了噪声环境中的说话人识别数据库。针对当前存在的不同的语音建模方法,通过实验的方法对各种分类模型进行了比较,通过对比各种模型之间识别效果的优劣和对噪声的鲁棒性,最终确定了采用识别率较高且在噪声环境的下降幅度最小的GMM-nv模型作为系统的基本模型。针对噪声所带来的信号空间、特征空间和模型空间的失配,我们需要将多种方法融合共同作用。为此,在特征空间我们详细研究了倒谱均值归一化等谱变量补偿方法;在模型空间我们提出了基于不同时段的直接倒谱加权的GMM,并根据医院不同时段的噪音种类和对数似然误差准则,评价各MFCC倒谱分量的平均贡献,根据各维特征的鉴别能力确定加权窗函数的形式。此外,我们又提出了最大化识别标准和段间联合识别标准用于医院环境中的应用,进一步提高了系统的识别效果。由于医院在不同的工作时段其噪声的组成成分和噪声种类并不相同,为了保证各个时段的识别都有较好的识别率,我们决定针对医院不同时段的噪声情况采用不同的识别方案。通过对多种融合方案的研究和对比参照实验,最终我们结合医院带噪声语音数据库确定了针对医院不同时段的说话人识别方案的形式。实验结果表明,本文所采用的方法可以显著提高系统在医院噪声环境下的识别率。
其他文献
建立了煤灰为床料的CFB锅炉内静态平衡计算模型.模型着重研究了成灰特性、灰磨耗和退档,颗粒停留时间及颗粒分层等影响循环流化床灰平衡的重要因素,并提出了相应的计算模型.
管磨机内部结构的优化既关系到水泥的能耗,又关系到它的质量。在管磨机内部结构优化改造过程中,细磨仓可安装使用优化设计的新型大区域活化环,充分激活小规格研磨体集群的粉
为了降低2500 t/d熟料生产线的煤耗,把着眼点放在分解炉性能的优化上。一是优化分解炉的供风,二是优化煤粉的燃烧和生料的均布,以实现煤粉的充分燃烧和碳酸钙更高的分解率。
本课题来源于市场和RS10-ERP产品的需求。本文对营销管理、定价策略、定价方法及汽车制造企业营销现状进行了分析研究。根据汽车制造业定价管理不同于其他行业的特点,提出了一
为应对激烈的市场竞争,适应金融服务业混业经营的发展趋势,国内外保险企业纷纷走上集团化经营、专业化运作的道路。国务院23号文件下发后,保险业迎来了新一轮发展热潮。加强
青年学生是祖国的未来、民族的希望,是社会主义现代化事业的建设者和接班人。他们的成长,直接关系到祖国的前途和命运。然而,在网络环境下,由于各种消极因素和不良环境的影响
金岗水泥有限公司生料辊压机终粉磨系统运行时SO2的排放浓度100%低于100 mg/Nm3,辊压机停机时SO2排放浓度会飙升至200~300 mg/Nm3。其特点是:SO2初始排放浓度不高(SO2最高瞬