基于循环神经网络的语音识别原理及实践

来源 :装备维修技术 | 被引量 : 0次 | 上传用户:dragoonzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:BP神经网络通过神经元之间的相互连接,由前向传播和反向传播方式优化行为参数,在当今的人工智能领域有着广泛的应用。循环神经网络优化了传统神经网络结构,通过记忆结节的信息流动,实现对具有时间连续性的数据进行处理和预测,LSTM则改进了RNN时间和空间的效率问题,引入了门控机制,降低神经网络中信息传递的复杂度。本文阐述了RNN及LSTM网络的基本理论,并用TensorFlow框架实现了网络应用。
  关键词:BP神经网络;RNN网络;LSTM
  1  BP神经网络
  人工神经元网络是通过众多神经元的相互连接而构成的自适应系统,具有动态自我更新的特征。BP神经网络是一种多层的前馈神经网络,其通过信号的前向传播,获取预测结果,再通过反向传播,得到相应的误差。通过这样的前向与反向流动,获取合理的权重与偏置。
  2  RNN理论及实践
  循环神经网络(Rerrent Neural Network, RNN),主要用于对具有时间连续性的数据进行处理和预测。在传统的神经网络模型中,网络可能有多层结构,但是层与层之间的神经元节点是孤立的,没有信息传递过程。而循环神经网络刻画了当前的状态节点与之前节点的信息关系,接收前端传来的上一时刻的信息作为重要的处理因子,进行计算输出,这使得当前状态时刻节点数据的处理更加复杂化。
  在某t时刻,输入样本因素值,并伴随着样本权重集合,通过输入因素的权重集合和上一时刻t-1的状态值的计算,得到t时刻的状态值。将此刻的状态值与输出的样本权重集合作为参数,通过激活函数的作用,得到输出预测的概率值。随着时间状态变化的序列值前行,一系列神经元节点输出预测值。可见,网络的输出概率值受之前的输入样本因子的影响。
  反射传播主要用于更新这些权重参数。在前向传播过程中,节点输出预测值会产生误差值,则在某t时刻,对这些参数的更新,用梯度下降法进行求得。
  以下是TensorFlow实现RNN记忆节点功能的主要操作:
  class RNNPoint(Layer_RNN_Cell):
  #inputs表示输入到节点的要素集合,state表示上一时刻的输入集合
  def call(self, input_datas, state_cell):
  #用来计算[input,state] * [W,U] == [Xt,Ht-1] * W
  data_input=math_ops.matmul(array_ops.concat([inputs_data,state_cell], 1), self._kernel)
  data_input = nn_ops.bias_add(data_input, self._bias)
  output = self._activation(data_input) #用激活函數来归一化操作
  return output, output  #第一个output参数返回下一时刻的输入S,另一个output作为下一层的输入
  3  LSTM(Long Short Term Memory, 长短期记忆网络)理论与实践
  一般结构的RNN网络中,网络节点某时刻状态与下一时刻状态之间是非线性的关系,而且相关参数都是节点之间共同拥有与使用,这会产生不可抗拒的梯度自然消失现象,同时理论的计算量巨大,导致数据训练所投入的时间和工作量呈指数增长。RNN中的节点单元无法确定信息量的价值,在记忆节点中存储很多无用的信息,而有利用价值的信息有可能被这些无用信息所侵占和排挤。为此,LSTM则将网络的状态分为内部状态和外部状态两种。LSTM 的外部状态是t时刻隐藏层的对外输出,同时也是t-1时刻隐藏层的输入,这是传统的RNN是一致的。LSTM的内部状态则引入了门机制,成为解决问题的重要关键点。
  LSTM记忆节点由输入门(Input Gate)、遗忘门(Forget Gate)、输出门(Output Gate)和单元状态组成。输入门判定有多少信息量能够保存到当前时刻的记忆节点中,作为记忆节点的保存数据的阀门,过滤掉不必要的数据信息,将输入信息与上一状态输出信息,经过权重参数的调整,作为激活函数的参数,得到是否通过的决定。遗忘门决定上一时刻的节点状态有多少需要保留到当前时刻的记忆节点中,哪些信息需要被丢弃,也是经过激活函数的作用,决定能否通过。输出门控制记忆节点输出的数据量,有多少信息需要输出给外部状态。输入门和遗忘门是LSTM 保证节点记忆长期依赖的关键所在。经过激活函数sigmoid的变换后,得到一个0-1之间的一个数值,用来作为输入门的控制信号。1表示数据可以通过该门,0表示该门完全关闭。以下是TensorFlow框架实现LSTM节点的主要操作。
  class BasicLSTM(Layer_RNN_Cell):
  def  call  (self, input_data, states, scope=None):
  with vs.variable_scope(scope or type(self).__name__):  # 基础LSTM节点
  concation = _linear([input_data, h], 4 * self._num_units, True); new_t = (c * sigmoid(f + self._forget_bias) + sigmoid(i) *self._activation(j));
  new_h = self._activation(new_t) * sigmoid(o); new_sta = array_ops.concat(1, [new_t, new_h]);
  return new_h, new_sta
  4  小结
  传统神经网络参数众多,在实践中存在着储多难题。循环神经网络优化了传统神经网络结构,通过记忆结节的信息流动,实现对具有时间连续性的数据进行处理和预测,LSTM则改进了RNN时间和空间的效率问题,引入了门控机制,降低神经网络中信息传递的复杂度。循环神经网络(RNN)解决了传统神经网络在数据中共享位置特征的难题,在语音识别、机器翻译、视频行为识别等诸多领域有着广泛的应用。
  参考文献:
  [1]杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机应用, 2018,38S2):6-11.
  [2]高茂庭,徐彬源.基于循环神经网络的推荐算法[J].计算机工程,2019(8).
  [3]余昉恒.循环神经网络门结构模型研究[D].杭州:浙江大学,2018.
  [4]朱肖颖,赖绍辉,陆科达.基于 LSTM 算法在新闻分类中的应用[J].梧州学院学报,2018,28(6):10-20.
  作者简介:
  王明松(1972- ),男,汉族,辽宁省营口市,讲师,硕士,软件工程理论及实践方向。
  张谦(1999- ),男,汉族,河北省沧州市,软件工程专业学生,本科。
  基金项目业:2020年国家级大学生创新创业训练计划项目(项目编号:202013892059)
其他文献
摘 要:系统介绍了钻井顶驱发展的历史、主要类型,详细列举了几个主流品牌中各型号的主要参数,及交流电驱动顶驱与直流电驱动顶驱的优势比较。  关键词:石油;钻井;驱动  石油钻井多年来一直采用标准的转盘和方钻杆钻井方式,利用转盘、方钻杆、钻杆B型大钳、吊卡、卡瓦和方补心接单根。这种钻井方式有两个突出的矛盾一直悬而未决,一是由于起下钻不能及时实现循环旋转功能,遇上复杂地层,或是岩屑沉淀,往往造成卡钻。二
期刊
摘 要:本文主要通过用一个实战项目:锂电池极耳折弯的机构设计,来通俗易懂的介绍下凸轮在非标机械中的设计思路流程及注意事项,随着现代计算机技术的发展,曹西京等[1]使用了计算机编程辅助技术,对摆动运动规律和直动运动规律的组合联动圆柱凸轮组合机构,进行了可视化设计,本文也会借助AutoCAD及SolidWorks二维和三维软件进行讲解说明。  关键词:凸轮机构;工艺流程;机构简图;时序图  1 一般凸
期刊
摘 要:目前的多轴钻床是通过标准工作头设计的,但是,这种设计有轴间距的限制和标准主轴的限制,应用不够灵活,为此,我们利用电磁吸盘,可以轻松更换不同规格和间距的主轴,扩大了多轴钻床的应用范围,在电脑模拟的基础上利用M7132电磁吸盘进行了相关参数的试验,并根据试验获得了初步结论。  关键词:多头钻床;电磁吸盘;轴间距;横刃  前言  M7132是一种常用的磨床,其电磁吸盘具有比较优异的性能,其技术相
期刊
摘 要:中小企业是我国国民经济中的重要组成部分,是推动经济高质量发展的主要动力。中小企业在发展过程中,由于企业规模小,受市场经济、管理原因、设备老旧及落后生产工艺、经营资金等因素影响,企业逐渐失去竞争力,部分中小企业出现经营困难,甚至破产倒闭的情况。文章通过调研某州市中小企业发展现状为研究背景,结合国外发达国家中小企业发展经验,提出中小企业提质发展对策及措施。  关键词:发展;现状;中小企业;对策
期刊
摘 要:对于我国的工业发展来说,机电一体化技术发挥着十分重要的作用。该项技术有着较强的综合性,其结合了电子、计算机、机械与信息技术中的一系列优势,对生产设备进行了有机组合,再通过信息化设备对生产设备实施控制,使工业生产效率得到了很大程度的提升。而将机电一体化应用在智能制造当中也是未来智能制造发展的主要方向,在进行智能制造时强化对机电一体化的应用水平能够进一步提高企业生产力、产品质量以及产品科技含量
期刊
摘 要:伴随着国家经济的高速发展,各种建筑工程越来越多,对建筑工程施工要求不断增加。装配式混凝土建筑工程凭借其突出的优点,工程应用不断增加。由于装配式混凝土建筑工程施工的特殊性,施工过程中各种危险因素较多,对开展安全施工监理工作,有着相对较高的要求。为此,笔者将要在本文中对装配式混凝土建筑施工监理的全过程安全管控要点进行探讨,希望对促进我国建筑工程事业的发展,可以起到有利的作用。  关键词:装配式
期刊
摘 要:金属材料在我国工业领域有着重要的作用,是我国工业生产过程中的重要生产原料,对于推动我国工业的发展和进步具有重要作用。然而金属材料具有容易被腐蚀的特点,而金属材料一旦被腐蚀则会对相关产品的外观和性能产生影响,因此对金属材料进行防腐保护十分关键。本文主要介绍了金属材料腐蚀的危害,分析了金属材料被腐蚀的类型以及金属材料表面腐蚀防护措施。  关键词:金属材料;防护措施;金属腐蚀  金属材料腐蚀是一
期刊
摘 要:探究金属粉末冶金工艺技术在汽车零部件制造中的应用,梳理粉末冶金工艺在油泵、刹车真空助力泵等汽车构件制造中的应用,阐解粉末冶金工艺的价值与具体应用原理。介于汽车领域的高速发展,需积极应用新材料、新技术,提高零件使用寿命,推动汽车业长足发展。  关键词:粉末冶金;汽车零部件;冶金工艺  粉末冶金从本质上分析就是制取金属粉末,或者说其用金属粉末是主要原理,在经过了一系列的成形与烧结之后,制造成最
期刊
摘 要:模具制造行业是我国工业的重点,是工业发展的关键设备,我国模具制造世界也享有美名。如今,橡胶作为最为常见的模压模具成为了研究的重点。所以 本文首先简要介绍了模压成型、浇注成型和热塑成型三种橡胶成型工艺,然后着重介绍了填压成型模具、压注成型模具和注射成型模具的结构特点和适用情况,其中填压成型模具又分为开放式、半封闭式和封闭式三类。最后介绍了橡胶模具设计加工中的材料要求、尺寸和公差要求、粗糙度要
期刊
强噪声背景下微弱信号检测技术是现代信号处理领域中的研究热点之一,在雷达、通信、声纳、生物医学信号等领域有着广泛的应用。Duffing振子检测是近年来用于微弱信号检测的一种新方法,对小信号十分敏感以及对噪声有很强免疫力,能达到常规方法所不能达到的信噪比门限,从而为微弱信号检测提供了新的研究方向。
  课题“基于Duffing振子的微弱信号检测方法研究”首先分析了单Duffing振子检测方程系统运动轨迹的变化规律,分别提出了实时性好和抗噪能力强的两种相变判别方法;其次研究了环形耦合Duffing振子间的