【摘 要】
:
话者识别技术因其独特的方便性、经济性和准确性,在生物特征识别领域中具有广阔的应用前景.现有的话者识别技术在理想条件下效果很好,但在实际环境中由于各种因素的影响,识别
论文部分内容阅读
话者识别技术因其独特的方便性、经济性和准确性,在生物特征识别领域中具有广阔的应用前景.现有的话者识别技术在理想条件下效果很好,但在实际环境中由于各种因素的影响,识别效果明显下降.该文研究的是与文本无关的话者辨认,目标是建立一个顽健的(Robust)话者辨认系统.该系统平台支持话者语音采集、离线话者识别以及在线话者识别;能够在话者训练语料不足情况下建立话者的模板;具有顽健的拒识策略.该文从目前应用最广泛的高斯混合模型(Gaussian Mixture Model,GMM)出发,运用GMM建立了一个与文本无关的话者辨认的基本系统,给出了总体结构方案和系统中采用的一些技术.然后对实现的系统分别从GMM混合数、训练和识别的数据量,以及话者数量方面对系统进行了一系列的基本性能测试.针对基本系统尚存的不足之处及具体的应用环境,从训练语料不足时的话者模板建立和拒识策略两个方面进行了研究.采用基于话者聚类的最大后验概率自适应模板建立方法,很好地解决了训练语料不足时话者模板的建立问题,实验表明,该方法比自适应前明显地提高了系统的识别率.在研究拒识策略时,提出了双阈值方法,并将它和反全局模板归一化方法结合作为系统的拒识策略.实验结果表明,该策略比单一的拒识策略提高了系统的识别率.此外,针对该系统的具体应用环境,还提出了一种平滑拒识策略,该策略结合反全局模板归一化和双阈值方法使用时,系统的识别率明显提高.最后对改进的系统的整体性能进行了测试,实验结果表明该系统的开集识别率达到了88.3﹪.
其他文献
在当今网络环境中,为了提高工作效率同时规范流程管理,处理定时任务的应用需求不断涌现,这些定时任务的特性就是有规律的重复执行,如果人为完成,非常困难也不安全。而定时调度就是
成像光谱是对地观测最前沿的技术之一,其应用十分广泛,机载成像光谱数据处理技术服务系统是一个为了提高数据处理、数据产品生成、规范化数据管理和分发效率的综合服务系统.
不确定信息处理是人工智能领域一个重要研究方向,从专家系统角度来看,大致有基于规则和基于模型两种不确定性信息处理方式。Bayesian网研究兴起于20世纪80年代,20世纪90年代以来
企业一级的计算机应用系统通常规模庞大,结构复杂。现阶段的企业开发,一般依赖于N层面向对象的平台,例如J2EE和.Net。这些平台都基于分布式网络环境,虽然能够有效地促进企业应用,
Internet是一个巨大、复杂、开放的网络集合,随着其重要性的日益提高,越来越有必要对网络整体拓扑结构进行深入地了解和分析,这对于保证和提高现有网络服务质量、推动互联网
对象代理模型(object deputy model)是一种新型的数据库模型,它引入了对象和代理对象这两个基本概念,并用对象和代理对象一起来模拟现实世界中的实体.代理类对源类的继承是一
并行数据库通过将一个关系中的元组分割放置在多个节点的磁盘上,利用I/O并行性,来获得较高的性能.如何对数据进行划分和放置就是所谓的数据放置(Data Placement)问题.数据放
随着信息技术的发展,各种应用领域的信息量都呈爆炸性增长趋势,高于10字节的海量数据仓库随处可见并且与日俱增.目前的数据仓库与多维联机分析处理(On-Line Analytical Proce
随着虚拟现实技术的发展,对三维图形的真实感要求越来越高,使基于图像的建模和绘制技术(IBMR)应运而生.它结合了计算机图形学、计算机视觉、图像处理、摄影测量学等许多学科
近些年,随着计算机技术的高速发展,计算机设备集成化的趋势越来越明显。一方面,计算机设备小型化和多功能化的程度不断提高,使众多小型化计算机已具备无线通信功能,另一方面,复杂的