基于文本无关的说话人识别研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:linjavac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别始于20世纪30年代,从20世纪70年代开始日益成为国际上的一个研究热点。说话人识别具有广泛的应用前景,如:说话人核对、司法取证、医学应用、声控电子密码锁等领域。正因为说话人识别具有如此广阔的应用前景,国内外许多研究机构和研究者长期从事于这一领域的研究,推动了说话人识别技术的发展,但它还未成熟。本文重点研究了与文本无关的说话人识别技术。首先,详细讨论了说话人识别系统的基本原理,接着介绍了语音信号产生的数学模型、语音信号的数字化及预处理,内容涉及语音信号的加窗分帧、预加重滤波、端点检测;重点讨论了传统的双门限比较法的端点检测,并给出了一种改进的端点检测方法:基于ICA增强和谱熵结合的端点检测;重点分析了当前最常用的语音特征参数:基于听觉模型的美尔倒谱系数MFCC的提取方法。其次,着重讨论了说话人识别中常用的两种识别方法:基于VQ的说话人识别方法和基于GMM的说话人识别方法。详细讨论了VQ的基本原理、失真测度、最佳码本设计以及介绍了基于FVQ的说话人识别方法,实验结果表明基于FVQ的识别率较基于VQ的识别率提高了近十个百分点;接着介绍了GMM的基本概念、模型参数的估计算法以及说话人识别算法的实现,通过实验确定了识别的最佳混合数M。通过不同长度的训练语音进行仿真实验,得出在实验条件相同的情况下,基于GMM的说话人识别识别率较好。最后对本文的工作进行了总结,同时对未来的研究工作进行了展望。
其他文献
抗微生物肽作为进化26亿年的古老防御分子,是多细胞生物天然免疫的重要组分。随着抗生素多重耐药菌株的泛滥,抗微生物肽已成为设计新型抗感染多肽药物的焦点。在后基因组时代,通
地球物理勘探作为研究和探索地球内部结构及资源分布的理论和方法,对于经济发展、城市规划、资源开发等都有着重要意义。多通道瞬变电磁法作为一种建立在电磁感应基础上的时间域电磁探测方法,具有更大的动态范围、更高的分辨率及更广泛的空间覆盖等优点而被广泛应用于:地质矿产、石油、煤炭、工程物探等行业。地球物理勘探系统中采集系统的数据回传是勘探过程的第一步也是数据处理分析成功的前提和保证,采集通道数的拓展,分布的
伴随着我国证券市场的发展,我国的私募基金也相也经历了从无到有的发展,但是我我国法律上对私募基金还没有做出明确的规定,因而全文对我国私募基金的现实状态、问题作出了概
时分同步码分多址技术(简称TD-SCDMA)是我国首个拥有自主知识产权的3G通信标准。目前,我国的GSM网络已经建设的相当成熟,运营也已相对稳定。由于TD-SCDMA系统占有的频段与GSM系
癌症是一个世界性的公共健康问题,是全球最主要的致死原因之一。由于人口增长以及老龄化问题的加剧,由癌症导致的经济负担也在快速增长,造成了严重的社会问题。现代人的生活方式
随着科学技术的发展,计算机技术在医学领域得到了广泛的应用,其中计算机辅助医疗外科技术及辅助诊断技术越来越受到人们的青睐,尤其是在医学显微图像处理方面的应用更是倍受关注
2013年11月5日至2014年2月15日,列支敦士登王室珍藏展将在国家博物馆北一、北四展厅举行。此次展览精选了巴洛克时期佛兰德斯画派的油画、版画与挂毯等一百余件杰出艺术作品,佛兰德斯画派是西方艺术史上巴洛克时期重要的艺术流派,国博相关负责人表示,此次展览共分为13个单元,系统、完整地为观众梳理与展示了一个鲜活、生动的佛兰德斯画派发展历程,再现了十六、十七世纪尼德兰南部地区的人文风貌、历史概况与城
下一代光网络是现阶段通信领域研究的热点之一,而自动交换光网络(ASON)是光传送网实现智能化控制的一个发展方向,而作为ASON核心的控制技术是目前光网络研究领域中的一个重点
紫砂工艺品之所以能成为艺术瑰宝,是因为它蕴含了厚重的文化底蕴。在竞争激烈的多元化文化框架中,紫砂器皿中蕴含的传统文化以其独特的艺术魅力,吸引着中外紫砂艺术爱好者的
写生与创作是源与流的关系。《艺术沙龙》:“写生”有三层意思:一是观察,二是感悟,三是记录。你认为写生重要吗,为什么?石里溪:写生足绘画创作的源泉,一切创作都是从自然和生