语种识别中基于局部多样性建模的向量空间模型

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xujin2003cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,最后对不同的模型进行加权组合。为了有效地对不同模型进行组合,需要对模型的加权系数进行优化。对模型组合算法从理论上进行推导,在模型权重与分数线性融合系数之间建立起对应的数学关系,并提出采用逻辑回归方法对不同模型的权重进行估计。在美国国家标准技术局(NIST)2009年度语种识别测试库上的实验结果表明:所提方法不仅能够处理大规模的训练数据,而且相比传统方法识别性能也有了一定程度的提高,系统的等错误率在30 s、10 s和3 s的测试条件下分别下降了8.44%、5.91%以及3.45%。 Aiming at the training of large-scale databases in language recognition, a vector space model based on local diversity modeling is proposed. First, the training database is divided into several small databases, and then each small database is used to train different vector space models. Finally, different models are weighted and combined. In order to effectively combine different models, the weighting coefficients of the model need to be optimized. The model combination algorithm is theoretically deduced, and the corresponding mathematical relationship is established between the model weight and the fractional linear fusion coefficient, and the logistic regression method is proposed to estimate the weight of different models. The experimental results on the National Institute of Standards and Technology (NIST) 2009 Language Recognition Test Database show that the proposed method can not only process large-scale training data, but also improve the recognition performance compared with the traditional methods. The error rate decreased by 8.44%, 5.91% and 3.45% respectively under the test conditions of 30 s, 10 s and 3 s.
其他文献
笔者分三点来讨论医院管理人才:医院管理人才的分类和重要性;医院管理人才选拔中存在的问题;如何做好医院管理人才的选拔与培养.
我是新宁县白沙镇云里村果农倪利祥(0739-4850013),我种植脐橙已有多年。2007年株洲丰瑞达实业有限公司在我村推广丰瑞达冲施肥,我抱着试试看的心情,在100株脐橙树保花保果时
大学阶段是心理健康发展的关键时期,在各种影响心理的因变量和自变量的共同作用下,大学生心理状态处于一个不断变化的过程中,这些变化最终影响甚至改变大学生的整体发展方向.
随着卫生体制改革的深化,医院服务质量不再是单一的服务态度,而是多方面集于一体的卫生服务.服务质量已经成为医院管理中的核心.笔者对服务质量分析的要求和内容进行了详细阐
如何改进高校的思想政治教育,提高高校思想政治教育的实效,一直是世界各国教育界面临的主要课题,更是我国高校关注的一个重点.本文力图通过研究世界各国思想政治教育的特征,
农村初中教育薄弱已成为一种普遍的社会现象。 The weakness of rural junior high school education has become a common social phenomenon.
本文采用麦可思研究院连续三年对中国应届大学毕业生求职与工作能力的调查数据,从本科、高职高专专业大类和主要专业小类着眼分析专业对毕业生毕业半年后就业率和薪资的影响.
医院的消毒供应中心直接关系到病人的生命和安全,也直接关系到医务人员的健康和安全[1]。由于消毒供应中心的工作环境及工作性质的特殊性,其职业危害因素已越来越被人们所关
为尽快科学合理地提高工作质量和效率,某院利用档案资料开展《岗位职责在医院工作中价值的研究》.实践证明是行之有效的.
本文通过对杂波实测数据的处理,利用高斯分布模型、指数分布模型、幂指数分布模型及高阶AR等分布模型,得到了双基地雷达前向散射地表杂波概率分布和功率谱分布的数学模型;并