融合用户反馈的语音转写结果快速纠错技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:felltwo23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,受益于大数据和深度学习技术的发展,语音识别技术取得巨大进步,语音识别准确率大幅提高。但是受环境噪音、口音、语义等方面的限制,语音识别错误仍然难以避免,特别是在专业领域的语音转写方面准确率难以满足实用需求,所以一般都需要对转写结果进行纠错处理。纯人工纠错效率极低,甚至可接近直接进行人工语音转写;而自动纠错对准确率提升有限,难以实用。针对这一问题,本文研究融合用户反馈的语音转写结果快速纠错技术,重点关注如何采用人机交互界面及自适应学习方法响应用户反馈,使用户通过少量的操作即可完成对识别结果的纠正,提升纠错效率。  本文主要研究成果如下:  1.提出融合非确定性反馈的混淆网络扩充方法  针对已有语音转写结果纠错方法反馈方式单一、候选列表准确率不足、词网格扩充效率低等问题,本文提出融合非确定性反馈的混淆网络扩充方法。该方法同时提供确定性反馈(候选选择、删除、插入)和非确定性反馈(拼音反馈、指示型反馈)等多种用户反馈方式,并可利用反馈信息,基于音节混淆矩阵和缓存语言模型对混淆网络进行扩充,提高混淆网络对正确答案的覆盖率。  2.提出基于混淆网络重估的候选列表更新方法  针对当前基于词网格的重估算法,存在词网格结构复杂导致系统响应速度慢、没有充分利用用户反馈的问题,本文提出基于混淆网络重估的候选列表更新方法。该方法以用户反馈信息作为上文约束,结合基于历史反馈信息建立的缓存语言模型,用Beam Search算法对新的混淆网络进行剪枝,对重估后的混淆网络计算每个节点的后验概率并重新排序,从而生成准确率更高的候选列表。实验结果表明,结合了混淆网络扩充和候选列表更新后,在多个领域的测试语料上,确定性反馈后用户输入比例减少14.79%至21.18%,平均响应时间小于0.04秒,指示型反馈后新候选列表准确率达68.7%-96.2%,平均响应时间小于0.2秒。  3.设计实现融合用户反馈的语音转写结果纠错系统  基于本文提出的方法,结合实际应用需求,设计和实现了融合用户反馈的语音转写结果纠错原型系统。本系统包含混淆网络扩充模块和候选列表更新模块,扩充模块为用户提供多种反馈方式,并利用用户反馈信息完成对混淆网络扩充;更新模块完成对混淆网络的重估排序。系统基于文档觎图结构,在逻辑上使数据和显示分开,降低系统的耦合性,提高语音转写结果纠错系统的扩展性和实用性。
其他文献
在国家863项目"基于Internet的以构件库为核心的软件平台"中,我们分析了目前已有的构件组装平台,使用现有的DCOM规范作为我们支持的构件模型,取得了如下的研究成果.●提出了
随着网络的快速发展,网络安全越来越多地受到重视。作为网络安全领域的一个重要分支,网络安全评估与防火墙等传统网络安全防护手段不同,它采用主动的方式来检测网络的安全性。通
视频压缩及传输由于具有广泛的应用前景,成为国际研究的热点。它是HDTV、DVD、视频会议、Internet视频及其它相关应用的核心技术。目前,由于现有标准的局限性,国际上提出了嵌入
随着嵌入式系统日益普及,基于嵌入式系统开发应用软件的需求越来越广泛,但是嵌入式系统资源(如CPU处理能力、内存容量、功耗等)有限,从而使在该系统上运行的应用软件的大小及运
信息技术和互联网的发展,深刻地影响了人们获取资讯的方式。人们的新闻消费模式已经从传统的订阅报纸,转变成了通过互联网访问成千上万的不同来源的新闻。互联网不仅加速了人们
轻纺产品图案的差异化和多样化是轻纺领域打造竞争优势的关键,因此图案的设计和制作在轻纺行业占据相当重要的地位。近年来,结合人工智能和图形图像技术的智能图案创作系统得到
协议是网络和通信的核心,协议形式化理论的研究是一项十分重要的基础性、前瞻性和创新性的研究.它主要包括协议形式化描述、协议验证、协议实现、协议测试等方面的理论和方法
时间序列模式、分类规则和关联规则挖掘是当前数据挖掘研究中一个热点。本文对时间序列模式、分类规则和关联规则挖掘的方法进行了深入的研究。挖掘规则及其它知识是一个多阶
随着空间信息管理技术的不断成熟和空间信息服务系统的逐步普及化,人们对随时、随地获取空间信息服务的需求越来越普遍也越来越迫切。与此同时,无线传输技术的更新换代和无线互
组件技术是解决软件危机、提高软件开发效率和质量的有效途径,有助于软件工程化、工厂化生产的实现.组件技术的出现是对传统软件开发过程的一次重大变革.Internet的飞速发展,