语种识别中基于局部多样性建模的向量空间模型

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：xujin2003cn

【摘要】

：

针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,

【作者】

：

邓妍张卫强刘加

【机构】

：

清华大学电子工程系清华信息科学与技术国家实验室,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2011年02期

【关键词】

：

语种识别向量空间模型美国国家标准训练数据局部多样性技术局加权系数模型加权建模预先计算

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,最后对不同的模型进行加权组合。为了有效地对不同模型进行组合,需要对模型的加权系数进行优化。对模型组合算法从理论上进行推导,在模型权重与分数线性融合系数之间建立起对应的数学关系,并提出采用逻辑回归方法对不同模型的权重进行估计。在美国国家标准技术局(NIST)2009年度语种识别测试库上的实验结果表明:所提方法不仅能够处理大规模的训练数据,而且相比传统方法识别性能也有了一定程度的提高,系统的等错误率在30 s、10 s和3 s的测试条件下分别下降了8.44%、5.91%以及3.45%。 Aiming at the training of large-scale databases in language recognition, a vector space model based on local diversity modeling is proposed. First, the training database is divided into several small databases, and then each small database is used to train different vector space models. Finally, different models are weighted and combined. In order to effectively combine different models, the weighting coefficients of the model need to be optimized. The model combination algorithm is theoretically deduced, and the corresponding mathematical relationship is established between the model weight and the fractional linear fusion coefficient, and the logistic regression method is proposed to estimate the weight of different models. The experimental results on the National Institute of Standards and Technology (NIST) 2009 Language Recognition Test Database show that the proposed method can not only process large-scale training data, but also improve the recognition performance compared with the traditional methods. The error rate decreased by 8.44%, 5.91% and 3.45% respectively under the test conditions of 30 s, 10 s and 3 s.

其他文献

干部人事制度改革与医院管理人才的选拔与培养

笔者分三点来讨论医院管理人才:医院管理人才的分类和重要性;医院管理人才选拔中存在的问题;如何做好医院管理人才的选拔与培养.

会议

干部人事制度改革医院管理人才人才选拔培养分类

丰瑞达冲施肥给我们果农增产又增收

我是新宁县白沙镇云里村果农倪利祥(0739-4850013),我种植脐橙已有多年。2007年株洲丰瑞达实业有限公司在我村推广丰瑞达冲施肥,我抱着试试看的心情,在100株脐橙树保花保果时

期刊

冲施肥脐橙白沙镇保花保果里村抱着广丰新宁县喷施着色期

影响大学生心理健康的变量分析

大学阶段是心理健康发展的关键时期,在各种影响心理的因变量和自变量的共同作用下,大学生心理状态处于一个不断变化的过程中,这些变化最终影响甚至改变大学生的整体发展方向.

期刊

大学生心理健康因变量自变量

服务质量分析在门诊管理中的应用

随着卫生体制改革的深化,医院服务质量不再是单一的服务态度,而是多方面集于一体的卫生服务.服务质量已经成为医院管理中的核心.笔者对服务质量分析的要求和内容进行了详细阐

会议

医院服务质量质量分析门诊管理卫生体制改革医院管理卫生服务服务态度

国外高校实施思想政治教育的主要做法及其借鉴意义

如何改进高校的思想政治教育,提高高校思想政治教育的实效,一直是世界各国教育界面临的主要课题,更是我国高校关注的一个重点.本文力图通过研究世界各国思想政治教育的特征,

期刊

国外高校思想政治教育做法借鉴

浅谈农村初中教育薄弱现象

农村初中教育薄弱已成为一种普遍的社会现象。 The weakness of rural junior high school education has become a common social phenomenon.

期刊

农村初中教育薄弱现象

高校专业对就业率和薪资的影响分析

本文采用麦可思研究院连续三年对中国应届大学毕业生求职与工作能力的调查数据,从本科、高职高专专业大类和主要专业小类着眼分析专业对毕业生毕业半年后就业率和薪资的影响.

期刊

专业就业率薪资影响分析

消毒供应中心的职业危害因素与防护对策

医院的消毒供应中心直接关系到病人的生命和安全,也直接关系到医务人员的健康和安全[1]。由于消毒供应中心的工作环境及工作性质的特殊性,其职业危害因素已越来越被人们所关

期刊

消毒供应中心职业危害因素锐利器械综合性医院针刺伤物品回收临床科室职业危害防护临床医技科室消毒与灭菌

岗位职责档案在医院中应用价值的研究

为尽快科学合理地提高工作质量和效率,某院利用档案资料开展《岗位职责在医院工作中价值的研究》.实践证明是行之有效的.

会议

岗位职责档案资料医院工作质量和效率科学合理证明实践价值

双基地雷达前向散射地表杂波统计特性分析

本文通过对杂波实测数据的处理,利用高斯分布模型、指数分布模型、幂指数分布模型及高阶AR等分布模型,得到了双基地雷达前向散射地表杂波概率分布和功率谱分布的数学模型;并

期刊

杂波前向散射双基地雷达杂波功率谱功率谱杂波功率谱模型目标检测性能高斯分布分布模型目标运动参数

语种识别中基于局部多样性建模的向量空间模型

其他学术论文