【摘 要】
:
文本无关的说话人识别由于不限制话语内容,不存在被测说话人合作态度问题,数据的获取相对容易,具有很宽的实际应用范围.本文将贝叶斯网络的理论与说话人识别的技术相结合,提
论文部分内容阅读
文本无关的说话人识别由于不限制话语内容,不存在被测说话人合作态度问题,数据的获取相对容易,具有很宽的实际应用范围.本文将贝叶斯网络的理论与说话人识别的技术相结合,提出文本无关的说话人识别的新的方法,进一步提高辨识率.论文的主要贡献如下:1)贝叶斯网络理论给出了相联系的事件之间简洁自然的概率分布关系和基于概率分布关系的学习算法与推理算法.2)对贝叶斯网络说话人识别方法进行了可用性研究,提出了用MFCC系数作为说话人声学特征、网络隐结点作为推理的隐含依据的系统架构方案和训练方法与识别方法.3)本文在实验观察的基础上,提出了融合MFCC特征和基频特征的贝叶斯网络说话人身份识别方法,给出了联系MFCC、基音频率和说话人身份三者的贝叶斯网络结构和训练方法与识别方法.4)提出了融合MFCC特征和基频特征的贝叶斯网络说话人性别识别方法,给出了联系MFCC、基音频率和说话人性别三者的贝叶斯网络结构和训练方法与识别方法.
其他文献
颅内压在临床治疗及监护危重病人时,是十分重要的一个监护指标,脑颅压力监测仪——既第一次穿刺时置导管于蛛网膜下腔,皮肤固定,然后连接该仪,其功能有有持续压力监测,定时、定量、
甲基溴作为一种熏蒸剂,在农业上有着广泛的应用。但作为一种受控制的ODS物质,己被列入淘汰时间表。我国是《蒙特利尔议定书》的缔约国,对甲基溴的淘汰承担着重要的责任和义务。
数据集成是指集成自治、异质的数据源中的数据,为用户提供一个统一全局模式,实现数据共享的问题。数据集成通常有两种实现技术:虚拟(virtual)技术和仓库(warehousing)技术。两种
合成孔径雷达(Synthetic Aperture Radar, SAR)由于其全天时、全天候以及穿云透雾观测的独特优势,在对地观测领域起着不可替代的重要作用,并且被广泛应用在目标识别,土地覆盖,海
摘要※ 无线视频终端技术是无线视频研究领域重要的组成部分,不同的应用需求和不同的网络设施状况,决定无线视频终端的异构性,因此,本文只就其中关键技术进行研究。 本文提
细胞核酸结合蛋白(cellular nucleic acid-binding protein,CNBP)是一个含有7个锌指结构(Cys-X-Cys-X-His-Xa-Cys,CCHC)的19kD蛋白,又称为锌指蛋白9(zincfinger protein 9,ZNF9)
随着现代科学技术的发展,数字成像设备的普及,人们可以轻易容易的获取图像,并将其上传到网络。这就造成网络图像的飞速增长。而图像、视频数据中,往往包含有用户的人隐私信息,一旦
随着现代网络规模的不断扩大,复杂性和异构性日益突出,给网络管理的理论和实践提出了新的要求和挑战。作为网络管理一项基本功能的网络性能管理也必须适应于现代网络发展的需要
随着医学影像技术的不断进步,现代医学成像技术和生物学发展十分迅速。分子影像作为一门新兴前沿的综合类学科,受到传统医学和计算机领域的充分重视。分子影像融合了分子生物化