基于支持向量机的说话人识别研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:inKin9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在说话人识别领域,基于支持向量机(Support Vector Machine,SVM)的识别方法是当今的研究热点。同其他模式识别方法相比该方法主要有两个不同点:一是它采用一个非线性核函数来表示特征空间的内积,另外一方面它采用分类间隔最大的最优分类超平面实现结构风险最小化。而这些特征使得支持向量机方法能得到广泛的应用。论文详细阐述了说话人识别的基本原理和实现过程。首先对特征参数的提取做了较深入的研究,对当今最常用的线性预测倒谱系数和美尔倒谱系数的理论基础和实现过程做了阐述,并将这些参数和其差分参数相组合,测试它们提取说话人个性特征的准确程度。用不同的特征参数构造说话人识别系统并考察它们对系统识别率和抗噪性能的影响。核函数是支持向量机模型的核心机制,函数类型的选择和参数的整定对于分类的准确度至关重要。论文阐述了核函数的基本理论,对目前常用的多项式核函数、径向基核函数及多层感知器核函数进行了仿真和分析,测试了它们在干净语音和加噪语音环境下的系统识别率和稳健度。为缩短说话人识别系统的训练时间,在对样本进行基于支持向量机的训练之前,需要对样本进行约简。论文总结了该领域的理论成果并给予归纳,提出了一种新的约简方法——支持聚类区提取法(SupportCluster Abstracting,SCA),阐述了该方法的理论基础并给出了具体实现步骤,并对SCA方法和传统的方法进行了实验和分析,用实验演示了算法对线性可分样本边界的描述准确度。考察了算法对线性不可分样本即语音样本在约简率和识别率方面的性能。SCA方法的参数的合适度决定了约简集是否能包含所有的支持向量同时尽可能减轻SVM训练的负担。论文通过试凑的方法对扇出系数、聚类数目及接近度因子等相关参数进行了整定,实验证明,和其他的约简方法相比,经过参数整定后的SCA方法能以较高的约简率获得较高的识别率,符合理论上预计的结果。通过实验考察了SCA-SVM模型与SVM模型以及其他说话人模型在性能上的差异。
其他文献
随着互联网的快速发展,XML已逐渐成为互联网上数据存储与交换的标准。但是,XML文件是以树状的结构来表示,每一次的数据查询都必须从树的根节点开始搜寻读取,透过每一层的标签
随着互联网深入到大家的生活之中,与互联网技术紧密联系的无线传感器网络无疑会得到长足的发展。无线传感器网络以通常意义上来讲就是利用传感器节点对某一区域进行感知、采
“结构决定功能”是系统科学的基本观点。如果将复杂系统内部的各个元素抽象为节点,元素之间关系视为连接,那么就构成了一个具有复杂连接关系的网络,通常称为复杂网络。自然
随着网络的快速发展,网络流媒体等数字视频显得无处不在,视频压缩编码也成为数字视频技术中重要的一部分。H.264作为一种最新的视频编码标准,拥有更高的压缩率和更清晰的视频
疾病诊断是医学领域的重要课题。各种医疗机构积累了越来越多的就诊样本数据,人工对样本进行疾病分类预测的结果限于经验、决策能力等主观因素的影响难以避免地出现误差,其分
Web服务发现是指服务请求者以某种方式在不同的Web服务中找到其需要的服务。由于传统的基于关键字的Web服务发现方法存在着低查全率和低查准率等缺陷,将语义引入Web服务发现
实体链接是把文本中的实体链接到知识库中的实体的过程,该工作有效地促进了机器翻译、问答系统、信息检索、信息融合、知识库补全等领域的发展。在实体链接的研究工作中,传统的
近年来,随着互联网的高速发展,网上的多媒体信息也急剧增加,在这些信息中,图像信息的数量巨大。面对浩瀚的信息海洋,人们迫切希望能够快速高效地获取所需要的多媒体信息。有
随着计算机技术,无线通信技术和社会网络概念的深入发展和结合,人们对于位置信息的需求不断扩大,获取移动定位信息的定位技术已成为当前的研究热点。传统的定位技术比较成熟,
云计算是一种新型的计算模式,采用按量付费的模式,为用户提供按需的、便捷的、可用的资源访问服务,有效提高了用户与数据间的交互和管理效率,具有非常广泛的应用前景。云计算