【摘 要】
:
本文主要利用各种声学特征参数基于GMM建模的方法开展了自动语言辨识的研究,主要的研究工作包括:1.六语种语音语料库的建立:利用已有的汉语语料库和从网络上采集的英、德、日、法
论文部分内容阅读
本文主要利用各种声学特征参数基于GMM建模的方法开展了自动语言辨识的研究,主要的研究工作包括:1.六语种语音语料库的建立:利用已有的汉语语料库和从网络上采集的英、德、日、法、西班牙等五语言的语音建立了多语种语料库。语料库的训练集中有264个说话人、每人60~300秒的语音,测试集中每个语种有30~50个训练集外的说话人,每个人有至少50个平均时长为4.5秒的语音片段。2.自动语言辨识系统的初步实验研究:建立了基于GMM的六语种识别系统,研究了系统识别率和GMM的混合分量数目与训练数据的多少的关系,以及RASTA滤波和CMS处理对MFCC参数性能的影响。3.提出了一种新的二次弯折函数,研究了基于基音频率均值的说话人归一化技术在自动语言辨识系统中的应用。利用对比实验来比较二次弯折函数与常规的线性弯折函数和分段线性弯折函数的性能。4.提出了滑动倒谱的概念,并将两种常用特征参数RASTA-MFCC和RASTA-PLP的滑动倒谱与当前研究中广泛采用的滑动差分倒谱进行了对比研究。然后进一步考察了RASTA-PLP滑动倒谱的控制参数在不同的取值情况下对识别性能的影响,利用爬山法确定了达到局部最优控制参数组合的路径。最后研究了RASTA-PLP的滑动倒谱与其它参数的特征级和决策级数据融合。
其他文献
纯母乳喂养是指在婴儿出生后的4-6个月内,不给其添加任何食物,单纯靠母乳来哺育婴儿的方法。这个方法一直以其优点多、方便而倍受产妇及其家属的关注。进行纯母乳喂养的关键是
EMV是国际金融业界对于智能卡与可使用芯片卡的POS终端机,以及银行机构所广泛设置的自动柜员机等所制定的专业交易与认证的标准规范,是针对芯片信用卡与现金卡
EMV is the i
<正> 云登坡上界头的山水多半呈动态的美,"狮子山"、"石栏杆关象"、"鲤鱼跳龙门"等地方都是依照山水之形命名的。从远处眺望,界头之北的桥头坝子中段有两座山格外引人注目,西
麦积山石窟早期洞窟的造像中,弥勒造像是最为重要的题材之一,有交脚、半跏思惟及佛装三种形式。其表现手法不一,代表了不同的内涵和信仰。
期货市场的功能体现在价格发现与风险转移两个方面。其中价格发现是核心,也是期货市场存在和发展的价值所在,风险转移功能能否良好发挥也取决于价格发现的效果。而期货市场对
目的:检测SD大鼠的血浆内毒素浓度,肝组织CD14和TLR-4表达在空白组、模型组、枳椇子组、治疗(枳椇子+酒精)组中的差异,研究枳椇子水提液对急性酒精中毒大鼠肝组织CD14和TLR-4表
如今网络已成为传统三大媒体之外的第四媒体,依赖于网络的网络广告也得到了很大的发展,但网络广告却因大量的劣质广告而备受网民的反感和抵触,富媒体广告可以说是为了对这一种情
介绍了美国能源部近期及远期(~2020年)的洁净煤计划,重点介绍了美国能源部V ision 21,FutureGen及CCPI 3个具代表性的计划,包括计划的基本特征、技术体系、预期目标及实施情
90年代初台湾对大陆投资急剧增加,在此背景下,台湾学术界产生了所谓产业空洞化的争论。争论的焦点在于:台湾是否面临失去资金、技术,并培养潜在竞争对手的局面;资金、技术和