基于注意力机制特征融合与增强的自然场景文本检测

来源 :无线电工程 | 被引量 : 0次 | 上传用户:liner1018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决自然场景文本检测中由于文本实例分布随机、 形态与尺度多样造成的检测难题,设计了一种基于注意力机制特征融合与增强的自然场景文本检测算法.利用注意力机制对有效特征提取的优势,在模型的解码融合阶段设计并引入了一种基于注意力的特征融合模块(Attention-based Feature Fusion Module,AFFM),利用空间和通道注意力分别为高层特征和低层特征引入更丰富的细节和全局信息,进一步提高了检测的准确率;设计了联合注意力特征增强模块(Joint Attention Feature Enhancement Module,JAM),利用卷积对级联后的特征在不同通道之间、 空间位置间的联系建模,并生成联合特征权重mask对级联特征做加权,从而提高信息的表征能力,有效减少误检与漏检.在Total-Text和ICDAR2015两个数据集上对模型做评估,测试结果表明,该方法的F1综合指标分别达到了85.1%和87.6%,均优于当前主流算法.
其他文献
提出了一种虚实映射视触觉感知的方法,该方法以定位基站坐标定位的真实世界模拟设备各操作元件坐标以及状态检测电路为基础,将得到的真实空间设备操作元件的坐标通过空间变换得到虚拟世界坐标和操作元件状态信息,将其映射至虚拟世界虚拟设备并显示,实现了在真实世界操作设备(触觉感知)在虚拟世界虚拟设备显示操作的结果或状态(视觉感知).该方法已应用于电气测试仪校准装置校准实操培训系统,使受训人员在校准实操过程中不仅具有视觉感知而且具有真实的触觉感知,有效提升了真实感和实操培训效果.所提出的方法可广泛应用于电力系统其他专业技
极限学习机(extreme learning machine,ELM)是一种广泛使用的浅层神经网络模型.针对ELM网络模型的优化问题,提出一种前置径向基函数(radial basis function,RBF)核的混合ELM网络模型.通过在原有的ELM网络前增加一个新的RBF映射层用于对原始样本空间进行核映射可以提取原始样本空间的局部特征,以改善原始样本空间的可分性;随后所级联的ELM网络用于RBF核映射空间样本的学习.基准数据集上的实验表明,所提方法将RBF核局部响应能力强的优点以及ELM网络泛化能力强
针对当前群组推荐精度较低等问题,将群组活动推荐转化为排序学习,提出了一种融合多上下文特征信息的贝叶斯群组推荐算法.首先借助线性判断分析文件主题模型,构建用户对活动的兴趣偏好,利用词频-逆文档频率统计算法求取用户对活动的时间偏好,引入密度估计法并结合用户参加活动的频数建立用户对活动位置的偏好概率模型;随后基于贝叶斯个性化排序为所有群组定义统一优化目标;最后根据群组对活动的偏好评分获得活动推荐列表.仿真实验对比表明:与3种单特征群组推荐算法相比,所提出的算法准确率至少提高了 29.51%、召回率至少提高了 3
2021年,我们开启“十四五”,踏上了新征程,向着第二个一百年的奋斗目标迈进.国家空间基础设施建设持续推进,应用体系进一步完善,卫星技术不断进步,通导遥融合加速,广泛进入各行各业,催生出更多的应用场景,卫星应用领域不断扩大,规模应用蓬勃发展.面对卫星应用新模式、新业态、新经济的不断涌现,人们的生产生活方式发生深刻改变.
期刊
C-V2X或LTE-V作为车联网(Vehicular Communication Networks,VCN)领域的新兴通信技术,能够有效提高道路安全和交通通信效率.在3GPP发布的R14标准中,引入不依赖于任何蜂窝基础设施的直连通信模式4,在模式4中车辆自主选择和管理其无线电资源.在不结合实际的交通场景的情况下对C-V2X模式4通信性能进行评估,提出了一种多信道传播模型下C-V2X模式4通信性能分析模型,验证了不同传输参数以及不同信号传播信道对性能的影响,试图设计更为完备的分析模型,探索参数的影响并调整参
5G大规模智能机器协同促使社会生产生活方式向安全、 高效、 便捷和绿色演进,但移动终端的有限能量存储将严重制约其协同质量.3GPP研究表明,基站发送节能信号可辅助终端显著降低能源消耗,针对利用有限的时频资源设计节能信号,简单有效地检测节能信号以应对严重的信号间干扰导致检测性能恶化等问题,提出了一种基于多级序列的多用户节能信号检测方法,并通过仿真评估验证了该方法检测性能的优越性.
5G网络是车联网(Internet of Vehicles,IoV)发展的关键一步,其低时延的特点可以实现自动驾驶车辆对前方实时交通信息感知的需求,为预先制动、 提前绕行等驾驶行为提供参考.针对混合交通场景中手动驾驶车辆可能会出现的危险驾驶行为,基于长短时记忆(Long Short-Term Memory,LSTM)网络和无线集群学习框架,提出了一种基于车联网的无线集群智能轨迹预测(Swarm Learning-based Trajectory Prediction,SLTP)算法.SLTP算法以智能网联
针对异质能量约束的集群学习(Swarm Learning,SL)系统中的节点选择问题,提出了一种基于组合多臂赌博机(Combinatorial Multi-Armed Bandit,CMAB)的能量感知的节点选择(Energy Aware Node Selection,EANS)算法.EANS算法考虑了集群学习所在无线网络质量对传输的影响,结合模型训练时延设计基于时延的优化目标,利用CMAB理论将原节点选择问题转化为在线的最小化时延的形式.再结合李雅普诺夫优化(Lyapunov Optimization)
受降水量、径流等因素的影响,水库的长期水位预测面临巨大挑战.提出了一种新的基于长短期记忆(Long Short Term Memory,LSTM)网络的时间序列模型,对沂沭泗流域中的石梁河水库水位进行了预测和性能评价.该模型整合了降雨、 水流和土壤含水量等历史信息,并通过实验获取最优预测步长,从而提高了模型的预测准确度,并且稳定性更好,避免出现较大的误差.实验使用Nash-Sutcliffe效率(NSE)、Pearson相关系数平方(R2)和绝对均方根误差(Root Mean Square Errors,
针对消息在信道传输过程中的成形损耗问题,提出了一种在Rayleigh衰落信道下基于低密度奇偶校验(Low-Density Parity-Check,LDPC)编码的星座成形系统.该方法基于脉幅调制(Pulse Amplitude Modulation,PAM)下的星座图,通过在发送端加入一个成形编码器(作用是提高输出比特为0的概率),使得星座图中低能量的符号比高能量的符号更容易被选中,从而提高成形增益.并且在解调器和译码器之间进行迭代译码,进一步提高了系统的性能.理论分析和仿真结果表明,在独立Raylei