端到端模型相关论文
光学乐谱识别(Optical Music Recognition,OMR)是一个研究如何通过计算方式自动读取文档中的音乐符号的研究领域。随着科技的不断发......
机器阅读理解任务在近年来备受关注,它赋予计算机从文本数据中获取知识和回答问题的能力。如何让机器理解自然语言是人工智能领域长......
智能设备的普及,让人们越来越感受到语音交互的便利。作为一种非常自然的人机交互方法,自动语音识别自二十世纪七十年代以来一直是......
人工智能技术发展至今,人机交互方式几经迭代,从最早的键盘鼠标方式到后来的触屏手写再到现如今的智能语音交互方式,对人们使用智......
骨架数据已被广泛用于动作识别任务,因为它们可以稳定地适应动态环境和复杂的背景。在现有方法中,骨骼数据中的关节和骨骼信息都被......
端到端(End-to-End)框架是一种基于深度神经网络可直接预测语音信号和目标语言字符的概率模型,从原始的数据输入到结果输出,中间的处理......
实时语音翻译技术作为翻译技术的分支之一,具有非常丰富的应用前景,例如外语视频的字幕生成,国际会议同传翻译等等。然而,不同于相......
当今社会,随着第二语言学习特别是英语学习越来越收到广泛关注,人们对计算机辅助语言学习系统的要求越来越高。错误读音检测与诊断......
文字是与社会生活息息相关的感知信息来源,相较于观感图像中的其他内容,文字包含着更精简的语义信息。随着5G技术与深度视觉网络的......
船舶检测与识别技术的发展对海上监视及服务工作起重要作用,目前卫星遥感图像船舶目标检测存在背景复杂、船舶尺度变化大等问题,妨碍......
日常生活中,人们的阅读量越来越多,但获取的有效信息却越来越少,这本质上源于信息过载。文本摘要技术可以帮助读者快速了解文章主......
随着移动通信的高速发展,嘈杂环境下的语音交流问题已经变成一个迫切需要解决的问题,如何有效的去除背景噪声对语音通信的影响,日......
近几年之内,互联网渗透于生活各处,随之而来的是网上充斥着海量的数据,使网络上的信息变得冗杂,知识图谱的出现能够解决此问题。知......
学位
医学影像配准是医学影像分析领域中的重要问题。医学影像配准的主要任务是将来自不同成像设备或不同时间、深度、视角的图像对应像......
随着计算机科学技术的快速发展,人们对人机自由交互的需求日益增大,语音识别技术作为实现人机智能交互的重要技术之一,迅速成为了......
回转窑作为生产流程中的核心设备,被广泛用于各种工业应用中,如电厂炉窑、水泥生产和钢铁生产等。窑的运行效率取决于各种参数,例......
作为自然语言处理的一个研究分支,机器阅读理解近年来不断受到研究者的关注。随着旧的测评数据集不断被攻克,阅读理解领域涌现了大......
随着互联网上新闻媒体和社交媒体的快速发展,这些网络媒体中存在着海量的中文文本,挖掘出文本中的重要信息具有巨大的应用价值,不......
智能化的时代正在加速到来,语音作为最自然便捷的交流方式,是推动生活与工作智能化的重要手段。语音识别(Automatic Speech Recogn......
随着互联网技术的发展和开源社区的兴起,开源代码的数量急剧增加,从开源社区中发掘出有用信息需要耗费大量的时间和精力。自动摘要......
问题生成任务旨在为文本生成相应的自然语言问句。传统方法主要通过复杂的人工规则将陈述句转化为自然问句,以此方法生成的问句往......
光学乐谱识别(Optical Music Recognition,OMR)是实现乐谱图像数字化的重要途径,在计算机音乐、数字音乐图书馆、计算机辅助音乐教......
摘要:端到端语音识别模型由于结构简单且容易训练,已成为目前最流行的语音识别模型。然而端到端语音识别模型通常需要大量的语音-文......

