基于有监督i--vector特征空间学习的说话人识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 3次 | 上传用户:guomenling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术作为身份识别应用中的重要技术之一,以其无需密码、无需个体接触、识别设备成本较低等优势,广泛应用于各种身份认证系统中,倍受企业与研究者们的关注。经过数十年的发展,说话人识别研究取得了巨大进展;其中,特征提取作为寻找说话人个性信息的重要手段一直是研究热点之一。在各类语音处理应用中,由于语音信号具有短时平稳的特性,一般采用短时的帧级声学特征来刻画语音。然而,说话人的个性信息往往蕴藏在较长语音段的统计特性中,因此如何从一段语音的帧级特征序列中提取出话语级说话人特征,就成为说话人识别研究的关注焦点之一。值得注意的是,话语级特征提取一般依赖于特征空间学习,而以身份-矢量(i-vector)特征空间学习为代表的一系列方法,最受研究者们的青睐。然而,目前的i-vector特征空间学习方法在如何有效利用类别信息方面仍然缺少深入研究,它们并没有充分利用好类别这一重要的先验信息。
  基于以上分析,本文围绕类别信息的有效性利用问题,以进行有监督的i-vector特征空间学习为目标,从两个角度开展研究:一是直接利用类别信息,通过寻找数据与其类别标签间公共信息的方式,来将二者的对应关系引入到i-vector特征空间学习中。二是间接利用类别信息,将能够有效利用类别标签的后端分类器与i-vector特征空间联合考虑,通过利用分类器学习过程中所获得的有利于识别不同类别数据的区分性信息,来反馈指导i-vector特征空间学习。本文主要研究内容与创新工作如下:
  (1)在直接利用类别信息方面,试图通过构建数据及其类别标签的公共子空间的方式,来引入它们间的对应关系;并借助偏最小二乘方法来选择一个包含二者有效信息最多,且相关性最大的公共子空间作为i-vector特征空间。进而提出基于公共子空间中相关性学习的i-vector特征空间学习方法,其所提取的i-vector特征由于受到类别信息的指导而更具有区分性;同时,还给出一种基于预测标签相关性的i-vector特征维度选择方法。实验结果表明,所提出的方法能够有效提升说话人识别系统的性能。
  (2)在直接利用类别信息方面,考虑到当开发集数据不充足时,其中所包含的信息量会减小。为此,试图对数据与其类别标签在潜在公共内容条件下的概率分布进行高斯先验假设,从而用先验信息来弥补少量数据所携带的信息量有限问题,并在该假设指导下建立起数据及其标签的关系。同时,借助概率偏最小二乘方法来学习使二者联合概率密度最大的公共隐变量表示,作为它们的公共内容,其所在空间即为i-vector特征空间。进而提出基于公共隐变量表示的i-vector特征空间学习方法,其所提取的i-vector特征不仅更具有区分性,而且由于引入先验假设而受小数据规模产生的影响较小。实验结果表明,当数据不充足时,与其他方法相比,所提出的方法能够有效提升说话人识别系统的性能。
  (3)在间接利用类别信息方面,考虑到用于会话补偿的i-vector特征空间(以下简称“会话补偿特征空间”)与后端分类器通常为互相分离的独立学习过程,其在求解自身参数后,无法利用后端分类器根据类别标签所学习到的区分性信息。为此,试图以识别任务来驱动会话补偿特征空间学习的方式,将会话补偿特征空间与分类器进行联合优化,从而将分类器学习到的上述信息反馈回会话补偿特征空间的学习过程中。同时,由于具有稀疏约束的字典学习方法能够有效进行会话补偿,而且能够为后端分类器提供更简单且易于被线性表示的特征。基于此,提出基于任务驱动字典学习的会话无关i-vector特征空间学习方法。实验结果表明,与其他会话补偿方法相比,所提出的方法能够进一步提升会话补偿后i-vector特征的区分性,并有效提升说话人识别系统的性能。
  (4)在间接利用类别信息方面,考虑到i-vector方法中包括分类器及其之前的多个阶段在内的学习方式,属于一种任务分段式的学习策略,各阶段均具有自己的独立优化目标,除分类器学习之外的各阶段均无法利用分类器学到的区分性信息。为此,试图以识别任务驱动各个阶段学习的方式,来将分类器学习到的上述信息反馈回其前的各个学习阶段中,从而使得它们均能够在统一识别任务指导下进行各自目标的优化。基于此,提出基于任务驱动多层联合优化的i-vector特征空间学习方法,将i-vector方法的各个阶段置于多层结构的各层之中,并对上述多层结构进行联合优化。实验结果表明,与各阶段进行独立优化的i-vector方法以及其他有监督的特征空间学习方法相比,所提出的方法能够有效提升说话人识别系统的性能。
其他文献
扩频通信系统中扩频序列的好坏直接影响到通信质量的好坏,因此为了寻找优良的扩频序列,最佳序列,序列偶等概念被相继提出。为了进一步扩展理想序列偶的存在空间,三值自相关二元序列偶的定义被提出,而因为几乎差集偶与三值自相关二元序列偶具有等价关系,所以几乎差集偶成为研究三值自相关二元序列偶的重要工具。本文利用两种计算机搜索算法,使用两种方法对几乎差集偶进行构造。
  首先,本文提出对差集进行减元素或者增元素操作后得到新的集合对来构造几乎差集偶的算法,以及使用8阶和10阶经典分圆类的算法,在进行编程的过程中加入
随着互联网的不断发展,在人们的生活与工作中,信息过载问题越来越严重,为了让人们在对自己的需求也不太明确的情况下,从海量的数据中找到自己需要的信息,推荐系统应运而生。推荐系统经过二十年的迅猛发展,协同过滤推荐模型已成为目前应用最为广泛的推荐模型。随着社交网络的发展,大量的社交信息也随之产生,越来越多的学者开始研究如何将社交信息融入到推荐系统中,以此提高推荐系统的推荐效果。信任信息是社交信息中的一种代表性信息,众多学者依据信任信息提出了许多基于信任关系的推荐模型,这些模型用不同的方式来解决推荐系统存在的数据稀
【中图分类号】G612 【文献标识码】A 【文章编号】2095-3089(2016)34-0287-01  俗话说:三岁看到老,没有规矩不成方圆。发展心理学认为,心态决定命运,细节决定成败,习惯成就未来。幼儿教育家陈鹤琴先生说:“人类的动作十分之八九是习惯,而这种习惯大部分是在幼年养成的。从幼儿教育规律来说,小班是幼儿跨入集体生活的一个转折点,也是进行常规教育的关键期。如果在这最佳期里,我们有目的
期刊
【摘 要】教师在课堂教学中有意识地设置一个个的问题,可以不断引起学生认识上的矛盾,促进学生思维的发展,有利于培养学生独立思考、认真探究、善于发现的好习惯。在语文教学中,我们要针对小学生的认知特点,充分利用教材,精心设置问题,简化教学头绪,成就语文课堂的简约和精彩!  【关键词】题眼 关键 重点段 重复 矛盾 结尾 想象 引申  【中图分类号】G623.2 【文献标识码】A 【文章编号】2095-3
期刊
【摘 要】农村初中学生视野狭窄,知识面狭窄,阅读量少。一部分农村初中学生,一上作文课就愁眉苦脸,抓耳挠腮。如何有效地提高农村初中生的写作水平,本文从两方面进行探讨:一、重視“作后评讲”和“作后指导”,实行“先写再评,后指导,多修改,二次作文”的作文教学模式。二、引导学生从生活和阅读中积累素材。  【关键词】作后评讲 作后指导 先写再评 修改作文 二次作文 积累素材  【中图分类号】G633.3 【
期刊
【摘要】《甜蜜蜜》内容为小说,以人物对话为主。这部作品对我来说有一定难度。特别是对于符合场景要求的口语翻译。希望通过这篇文章的翻译能够提高自己对情景口语翻译的把握,准确表达文章的内容。  本报告首先介绍了文章的体裁,作者风格。接着介绍了规划和异化理论及归化和异化理论在本文翻译过程中的应用情况。后面整理阐述了翻译过程中用到异化和归化理论翻译的典型句子,分析了采取归化或异化方式翻译的原因和翻译后的效果
期刊
在雷达、扩频通讯、信号检测等很多的研究方向中,不同种类的序列都会被需要。尤其是随着通讯领域的不断发展,对于序列的需要也变大了。最佳信号的异向循环自相关函数值(旁瓣值)是0,但是并不容易得到,而且序列和序列偶的研究受到了限制。在这个基础上,几乎差集偶的概念被提出来了,方便了三值自相关二元序列偶的研究。本文主要是通过计算机搜索得到数据,来总结规律构造出平衡几乎差集偶和几乎最佳自相关二元序列偶,且几乎最佳自相关二元序列偶与几乎差集偶有着等价关系。
  首先,分析了二元序列、差集偶以及几乎差集偶和几乎最佳自
【中图分类号】G633.41 【文献标识码】A 【文章编号】2095-3089(2016)29-0009-01  轉眼间,自己作为英语教师已经六年多了。可能是由于在乡镇的关系,学生的基础较差。所以,刚入学时,我几乎都会发现学生们对英语的兴趣并不是很高,对待英语既有点好奇又有点害怕。在这种情况下给予怎样的引导,才能使他们更好、更快地走进英语的世界并且爱上学英语这件事呢?这成了我一直在思考并努力为之探
期刊
磁共振成像(MRI,Magnetic Resonance Imaging)是一种安全、无辐射的新型医学成像技术,它能够提供高对比度的人体组织影像,并且成像方式灵活,可以通过多参数成像突出不同组织的细节信息。然而,MRI扫描时间较长,但扫描对象无法长时间保持静止不动,因此MRI成像容易产生运动伪影。增加扫描层厚能够提高扫描速度,但层厚越大,MRI图像的空间分辨率越低,并且容易产生部分容积效应,不利于疾病的分析与诊断。因此,如何获取高分辨率的MRI图像是一个亟待解决的课题。近年来,基于深度卷积神经网络(DCN
【中图分类号】G4 【文献标识码】A 【文章编号】2095-3089(2016)34-0293-02  一、背景  某日,我班学生英语测验,迟放学十分钟。第二日到校,听同事说昨天放学后,相邻两班学生因口角发生矛盾并在校外摆开场子寻事,我班学生围观者较多。我先在本班学生中了解了一下情况,让围观者自己说明昨天究竟怎们回事,为何围观,有没有参与,学生第一反应都是推卸责任。第二节下课后,我们三位当事班的班
期刊