【摘 要】
:
实体关系抽取能够从文本中提取事实知识,是自然语言处理领域中重要的任务.传统关系抽取更加关注于单实体对的关系,但是句子内包含不止一对实体且实体间存在重叠现象,因此重叠实体关系抽取任务具有重大研究价值.任务发展至今,总体可以分为基于序列到序列、基于图和基于预训练语言模型三种方式.基于序列到序列的方式主要以标注策略和复制机制的方法为主,基于图的方式主要以静态图和动态图的方法为主,基于预训练语言模型的方式主要以B E RT挖掘潜在语义特征的方法为主.回顾该任务的发展历程,讨论分析每种模型的优势及不足点;结合目前研
【机 构】
:
河海大学 计算机与信息学院 水利部水利大数据重点实验室,南京 211100
论文部分内容阅读
实体关系抽取能够从文本中提取事实知识,是自然语言处理领域中重要的任务.传统关系抽取更加关注于单实体对的关系,但是句子内包含不止一对实体且实体间存在重叠现象,因此重叠实体关系抽取任务具有重大研究价值.任务发展至今,总体可以分为基于序列到序列、基于图和基于预训练语言模型三种方式.基于序列到序列的方式主要以标注策略和复制机制的方法为主,基于图的方式主要以静态图和动态图的方法为主,基于预训练语言模型的方式主要以B E RT挖掘潜在语义特征的方法为主.回顾该任务的发展历程,讨论分析每种模型的优势及不足点;结合目前研究的最近动态,对未来的研究方向进行展望.
其他文献
面对多样化的应用环境,卷积神经网络(CNN)的架构深度不断增加以提升精度,但同时需要大量的计算参数和网络存储.针对CNN卷积层参数冗余和运算效率低的问题,提出一种基于分层阈值的自适应动态剪枝方法.设计自适应分层阈值判断算法,对批归一化层的尺度因子进行聚类分析,自适应地找到每层的分类断点并据此确定最终阈值,利用该阈值修剪正则化后的输入模型,从而避免根据经验人为定义固定阈值,减小模型尺寸和运行时占用的内存.分别采用该方法和LIU等提出的使用固定阈值且全局修剪的方法对VGGNet、ResNet、DenseNet
现有级联非线性加性噪声模型可解决隐藏中间变量的因果方向推断问题,然而对于包含隐变量和级联传递因果关系的因果网络学习存在全局结构搜索、等价类无法识别等问题.设计一种面向非时序观测数据的两阶段因果结构学习算法,第一阶段根据观测数据变量间的条件独立性,构建基本的因果网络骨架,第二阶段基于级联非线性加性噪声模型,通过比较骨架中每个相邻因果对在不同因果方向假设下的边缘似然度进行因果方向推断.实验结果表明,该算法在虚拟因果结构数据集的不同隐变量数量、平均入度、结构维度、样本数量下均表现突出,且在真实因果结构数据集中的
信号子空间聚焦(FSS)算法可实现宽带相干信号的波达方向(DOA)估计,但其在短快拍条件下存在估计精度差、分辨率低的问题.提出一种改进的信号子空间聚焦(MFSS)算法.根据波长间隔与阵元间距的匹配度选取最佳参考频点及子频带,通过Hankel矩阵奇异值分解重构子频带的协方差矩阵,并利用信号子空间聚焦法构造聚焦协方差矩阵,使用Root-正交传播算子实现DOA估计.实验结果表明,相比FSS、MTOPS、LR-MUSIC算法,MFSS算法复杂度较低,能够有效提高估计精度和速度.
正交频分复用系统中的信号在传输过程中受到无线信道环境衰落和延时的影响,容易产生符号间干扰(ISI),对信道状态信息进行准确估计是降低ISI、提高信号传输准确率的有效方法.针对贪婪迭代类压缩感知信道估计算法存在的估计径错误及漏选问题,提出一种基于离散傅里叶变换(DFT)寻径的压缩感知信道估计算法DFT-OMP.通过DFT寻径的方式抑制由噪声引起的不理想原子,从而对OMP算法重构过程中的原子进行筛选,解决传统方法选取相关因子最大的原子作为重构原子而导致的依赖信号稀疏度问题.在原子预选后的贪婪迭代类压缩感知算法
在无线通信网络环境中,分布式客户端节点在用户隐私保护、数据传输效率、能量利用效率之间较难实现平衡.针对该问题,提出一种结合联邦学习与传统集中式学习的能量与信息管理优化策略.以覆盖性强、适用性广的移动信息采集设备作为学习服务器,将分布分散、资源受限的客户端节点作为学习参与者,通过构建马尔科夫决策模型分析客户端节点在移动信息采集过程中的状态变化和行为模式,同时采用值迭代算法和深度强化学习算法对该模型进行近似求解,获得客户端节点最优的信息传输与能量管理组合策略.仿真结果表明,相比MDP、GRE、RAN策略,该策
图像在获取过程中受传感器、光学系统、大气扰动等多因素影响,导致图像分辨率下降.提出一种结合内外部梯度先验的图像超分辨率重建方法.基于最大后验估计理论框架,将深度学习的外部梯度先验和?0范数的内部梯度、亮度联合约束先验相结合,通过联合利用外部梯度先验和内部梯度先验的互补优势,借助高分辨率的梯度信息提高重建的超分辨率图像质量.实验结果表明,与ASAR、DRRN等方法相比,该方法能够有效增强图像的高频细节和边缘信息,减少重建图像中可能存在的噪声与伪影效果.
针对H.266中基于历史块的运动矢量预测(HMVP)技术在换行更新列表过程中无法参考之前运动信息,以及HMVP候选列表在加入Merge列表过程中存在繁琐的去冗余过程的问题,提出一种改进的H.266合并模式候选决策算法.通过临时存储一个HMVP候选列表来解决原有HMVP列表在换行清空时存在的无法参考之前运动信息的不足,从而更好地预测运动信息.通过Merge候选列表中原有的空时域候选数量来确定需要进行去冗余的HMVP候选数量,以简化去冗余过程.实验结果表明,与H.266标准算法相比,该算法在随机接入的配置下,
传统点击率(CTR)预测模型多在单一特征级上进行特征交互,未能充分利用不同特征级上的有效信息.基于特征增强聚合方法提出一种融合广告CTR预测(APNN)模型.在CTR预测模型的嵌入层中引入一阶信息重要性进行特征增强,通过注意力因子分解机(AFM)模型与基于乘积产生层的神经网络(PNN)模型融合不同特征级交互特征和增强的嵌入特征,并利用多个全连接层从融合特征中获得更多潜在的高阶信息.实验结果表明,相比AFM、PNN、FNN等模型,APNN模型的预测精度较高,其在Criteo数据集上的AUC和LogLoss指
自闭症谱性障碍(ASD)是一系列复杂的神经发展障碍性疾病,其包括若干与发育障碍相关的疾病,但是现有的自闭症辅助诊断方法大多是二分类方法,无法满足现实的需要.此外,ASD数据包含的标记噪声,以及高维度、数据分布不平衡等特点给传统分类方法带来了巨大的挑战.为此,提出一种新型的ASD辅助诊断方法,该方法通过引入标记分布学习(LDL)来解决标记噪声问题,引入代价敏感机制来解决样本不平衡问题,并采用基于支持向量回归(SVR)的标记分布学习方法,通过将样本映射到特征空间,解决高维特征带来的分类困难,最终实现多分类AS
知识推理是知识图谱补全的重要方法,已在垂直搜索、智能问答等多个应用领域发挥重要作用.随着知识推理应用研究的不断深入,知识推理的可解释性受到了广泛关注.基于深度强化学习的知识推理方法具备更好的可解释性和更强的推理能力,能够更加充分地利用知识图谱中实体、关系等信息,使得推理效果更好.简要介绍知识图谱及其研究的基本情况,阐述知识推理的基本概念和近年来的研究进展,着重从封闭域推理和开放域推理两个角度,对当下基于深度强化学习知识推理方法进行了深入分析和对比,同时对所涉及到的数据集和评价指标进行了总结,并对未来研究方