【摘 要】
:
[目的]针对短文本篇幅较短、特征稀疏等问题,基于双向长短时记忆网络,提出一种改进注意力的端到端短文本分类模型.[方法]采用预训练词向量完成原始文本数字化;利用双向长短时
【机 构】
:
辽宁工程技术大学电子与信息工程学院 葫芦岛125105;辽宁工程技术大学电子与信息工程学院 葫芦岛125105;阜新力兴科技有限责任公司 阜新123000;
论文部分内容阅读
[目的]针对短文本篇幅较短、特征稀疏等问题,基于双向长短时记忆网络,提出一种改进注意力的端到端短文本分类模型.[方法]采用预训练词向量完成原始文本数字化;利用双向长短时记忆网络进行语义特征提取;在此基础上,改进注意力层将正向和反向特征进行融合,用于全局注意力得分计算,以获得具有深层语义特征的短文本向量表示;采用Softmax给出样本标签的分类结果.[结果]相比于传统的卷积神经网络、长短时记忆网络以及双向长短时记忆网络模型,基于双向长短时记忆网络的改进注意力模型在包含中英文的多个数据集上分类精度取得提升,其中最高提升为19.1%.[局限]仅针对短文本分类问题,对于篇幅长度较长文本,模型分类精度提升有限.[结论]基于双向长短时记忆网络的改进注意力模型实现短文本分类,能够充分利用文本的上下文语义特征,有效地克服短文本特征稀疏,提高短文本分类性能.
其他文献
本文采用了一种新的主轴回转误差测量方法,该方法解决了以往测试方法中存在的测量基准安装偏心和消偏失真问题。 本文综述了主轴回转误差测量方法和测量理论,从主轴回转
关于近作“竹”系列记者(以下简称记):你是从什么时候开始以“竹”为题材进行创作的?冷军(以下简称冷):好像是2007年春节期间在武汉画院里大家聚起来画画的时候,屋里要放一些
近年来,随着人们安全意识的不断增强,瓦斯爆炸事故发生频率开始有所下降,但特大型事故仍时有发生。因此提高现有瓦斯检测仪的性能就显得至关重要。由于瓦斯的主要成分是甲烷,
本文在阐述艺术设计专业教学资源库建设必要性的基础上,强调认为资源库建设应遵循实用性、系统性、特色性三大原则,在组织架构上应该包括专业课程资源库、教学素材资源库、技
互联网的飞速发展有力地促进着网络技术在机器人控制领域的应用。在基于网络的机器人控制中特别受关注的是移动机器人的远程控制,机器人的控制体系电逐渐由最初简单的对异地
本文先综述了国内外直线电机在机床上的应用现状,分析了微细电火花小孔成型机采用直线电机的优点,并对直线电机伺服进给控制系统的部分硬件电路进行了分析与设计介绍,选择TI
摘 要:针对燃煤锅炉SCR烟气脱硝系统喷氨现状,进行科学合理的分析,并详细介绍燃煤锅炉SCR烟气脱硝系统喷氨优化调整的重要性、燃煤锅炉SCR烟气脱硝系统结构组成,提出相应的优化调整方案,希望能够给相关工作人员提供一定的借鉴。 关键词:燃煤锅炉;SCR烟气脱硝系统;喷氨优化调整试验 中图分类号:TM621.8 文献标识码:A 文章编号:1004-7344(2018)18-0208-02 在众多
在新课程改革的背景下,各学科教学要凸显出一定的交叉性与协同性.例如培养小学生的阅读能力,已经不仅仅是语文教师的工作任务,数学教师同样需要通过开展“阅读”训练推动小学
喷煤是近代高炉节能的重大技术措施之一,特别是喷吹烟煤,具有无可比拟的优点。但是,我国高炉主要喷吹无烟煤,仅有为数不多的高炉喷吹烟煤,而且喷吹烟煤的比例较低,在整个喷吹总量中
目前国内主要有四种绿色债券:绿色金融债券、绿色企业债券、绿色公司债券和非金融企业绿色债务融资工具.这四种债券发行制度、适用标准各不相同,差别如下:rn一、A公司发行绿