嵌入注意力机制的自然场景文本检测方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:Orange_zz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法.利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围.实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中.
其他文献
深度学习技术发展迅速,在医学图像处理领域取得了显著成果.但是由于医学图像样本少,标注困难,使得深度学习的效果远未达到预期.近年,利用迁移学习方法缓解医学图像样本不足的问题,提高深度学习技术在医学图像领域的效果,成为了研究热点之一.介绍了迁移学习方法的基本概念、类型、常用策略及模型,根据迁移学习方法的类型,对当前医学图像领域具有代表性的相关研究进行了梳理与小结,对该领域的未来发展进行了总结和展望.
针对麻雀搜索算法存在的迭代过程中种群多样性减少且容易陷入局部最优以及收敛速度慢等问题,提出混合策略改进的麻雀搜索算法(MSSSA).利用Circle映射初始化麻雀个体位置,增加初始种群的多样性.结合蝴蝶优化算法(BOA)中蝴蝶飞行方式,改进发现者的位置更新策略,增强算法全局探索能力.采用逐维变异方法对个体位置进行扰动,提升算法跳出局部最优的能力.在仿真实验中与4种基本算法和5种改进算法基于10个基准测试函数进行比较并进行Wilcoxon秩和检验,结果表明所提算法具有更好的收敛性和求解精度,全局寻优能力得到
随着深度学习的不断发展,唇语识别领域的研究取得了重大进展,涌现了许多唇语识别的深度学习算法.依据识别对象的连续性,将唇语识别分为孤立唇语识别和连续唇语识别,并对各识别任务的深度学习方法进行了详细和深入的分析总结.从孤立唇语识别的深度学习方法和连续唇语识别的深度方法两个方面介绍了主流唇语识别方法,并对各方法的优缺点和性能进行比较;对不同数据集下代表性方法的特点和性能进行比较,对两类方法的优缺点和适用范围进行阐述;讨论了唇语识别方法存在的问题和挑战,并对唇语识别方法的研究趋势进行了展望.
针对证据组合过程中修正权重的确定问题,提出了一种综合考虑证据间关联关系和自身不确定度的改进修正权重确定方法,实现了对待组合证据的有效修正.基于对证据信息随机性和不具体性的阐述,得到了证据综合不确定度的度量方法.结合基于改进冲突度的相似性权重和基于综合不确定度的可靠性权重,确定了改进的修正权重.应用Dempster组合规则对修正后的加权平均证据进行有效组合.算例分析结果表明,所提方法能够充分利用证据信息,解决证据冲突,组合结果更为客观、准确,可信度更高.
针对委托股权证明(Delegated Proof of Stake,DPoS)共识机制系统中节点活跃度不高、错误节点剔除不及时、记账收益分配不合理等问题,提出了一种改进方案.改进方案主要改进了DPoS的计票机制和激励机制.改进的计票机制将节点的更多信息纳入了计票范围,使得选票能够更全面地反映节点的信用情况.根据节点的投票记录,动态调整节点选票的权重加快错误节点的剔除.对于激励机制的改进分为投票激励和记账激励两个部分,投票激励针对所有参与共识的节点给予相应的激励,激励系统中的节点积极参与投票.记账激励是根据
近年来预付费消费模式倍受商家和消费者的青睐,在娱乐健身、教育培训、商超零售等服务业中得到广泛应用.现有预付卡管理中存在商家欺诈高发、商家违约频发、监管不善等诸多问题,难以保障消费者的权益.当前,基于区块链的智能合约技术具有去中心化、安全性高、可验证等特性,可用来有效管理预付卡,为解决预付卡管理存在的问题提供了新思路.因此提出了一种基于区块链的公平预付卡管理方案,消费者和商家通过与智能合约的交互完成交易,利用智能合约的暂存价值完成预付款的管理.消费者和商家共同确认消费成功后,由智能合约自动结算本次消费费用给
为提升隐写分析的效率和准确率,并适应多尺寸输入图像,提出一个基于高效特征融合的可变尺寸图像隐写分析模型.在预处理层中,将经空域富模型的多阶高通滤波器初始化的多尺寸卷积核加入网络学习中,以提升模型的收敛效率和检测性能;在特征提取层中,采用特征融合思想,设计两个由Ghost瓶颈层、残差模块、密集连接模块组成的子网络,并融合输出的抽象隐写语义特征和非线性的高维隐写特征,以获得隐写特征的依赖性信息,增强模型的特征表达能力;采用改良版空间金字塔池化以自适应可变尺寸的图像样本,并丰富隐写特征的多样性.经仿真分析可知,
话题演化分析是舆情监控的研究热点之一,面向微博热点话题进行演化分析,对于网络用户以及网络监管部门都有很重要的现实意义.针对在线词对主题模型(On-line Biterm Topic Model,OBTM)新旧主题混合、冗余词概率相对较高的问题,对OBTM进行改进,提出基于话题标签和先验参数的OBTM模型(Topic Labels and Prior Parameters OBTM,LPOBTM).根据微博热点话题的话题标签,将微博文本集区分为含话题标签和不含话题标签的两类数据集,并设置不同的文档-主题先验
近年来无锚框的目标检测算法逐渐被应用于SAR舰船检测,其中FCOS算法摆脱了对锚框参数设置的依赖,对多尺度、多形态舰船检测的鲁棒性更好,但仍存在两个问题:第一、该算法直接进行逐像素点回归,因搜索空间过大、目标回归困难导致检测不够准确;第二、其中特征金字塔对低层特征利用仍有不足导致小目标大量漏检.针对上述问题基于FCOS进行改进,通过增加特征增强网络构建了二阶段无锚框检测算法.该网络作为第一阶段对检测过程进行精细化引导,同时增强了舰船特征表达能力.通过引入更多特征并增加跳跃连接改进特征金字塔,提高了低层特征
为了解决实际中动态表情识别存在的局部遮挡问题,提出一种基于并行Gan网络的有遮挡动态表情识别方法.构建一个并联网络P-IncepNet进行上下文特征提取,利用条件对抗网络训练了一个处理不同程度遮挡的图像修复网络.将构建的并联网络与LSTM进行级联,充分利用并联网络的特征提取和LSTM的时空信息获取能力,训练得到一个更具鲁棒性的动态表情识别网络.实验结果表明,在CelebA和MMI数据集上训练的局部遮挡补全网络对中小程度遮挡的补全优于其他网络;构建的级联表情识别网络对于不同程度遮挡的识别结果显示,修复表情图