基于多任务学习的端到端维吾尔语语音识别

来源 :信号处理 | 被引量 : 0次 | 上传用户:kissonegougou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语是黏着语,词汇量较多,容易出现未登录词问题并且属于低资源语言,导致维吾尔语的端到端语音识别模型性能较低.针对上述问题,该文提出了基于多任务学习的端到端维吾尔语语音识别模型,在编码器层使用Conformer并与链接时序分类(CTC)相连接,通过BPE-dropout方法形成鲁棒性更强的子词,以子词和字作为建模单元,同时进行多任务训练和解码.实验结果分析发现,子词作为建模单元能有效解决未登录词问题,多任务学习模型能在低资源环境下较充分利用数据,学习到丰富的时序语音特征信息,进一步提升模型的识别性能.在公开的维吾尔语语音数据集THUYG-20上与基线相比把子词错误率和字错误率分别降低7.3%和3.8%.
其他文献
深化消防执法改革以来,消防产品市场准入限制放宽,行业主管部门机构改革重组,各类因素导致过渡期消防产品存在市场准入门槛降低、流通渠道多元化、产品质量合格率下降等诸多问题.通过对消防产品质量相关数据进行分析,剖析问题原因,提出深化消防执法改革后以分段监管模式推动消防产品质量综合治理的方法,为解决现阶段消防产品监督执法存在的突出问题,有效改善不良市场竞争行为,净化消防产品市场提供参考.