基于复合模型的多标签分类算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mailxxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签图像是指一张图像中含有多个关注对象的图像,对于多标签图像的研究主要是多标签图像分类。多标签图像分类目前存在的问题主要是分类精度和分类时间没办法有很好的平衡,并且模型的适应能力较差。多标签图片学习目前主要的方向是问题转换和模型适配,问题转换主要是在思想和策略上进行优化,模型适配是通过改变模型的结构来适应多标签,为了得到更强泛化能力的模型,本文在多标签图像分类中开展了详细的研究,主要贡献如下:(1)提出了问题转换和模型适配两个方向的改进方法,针对多标签图片分类场景模糊和方法选择困难的问题进行研究,在问题转换的方向,设计了基本分类模型和结合高级策略的分类模型,在模型适配的方向,对多标签输出改造并采用迁移学习进行训练。最后发现问题转换方法在小数据集中能得到比较好的分类效果,但是分类的时间是模型适配的数倍,模型适配的方法可以节省大量的时间,更容易进行推广。高级策略可以减少部分预测时间,但是精度会有一定的下降。(2)提出了MobileNetV2特征提取网络结合可解释的集成模型的网络结构,针对图片多标签分类问题分类时间过长问题,先采用迁移学习对MobileNetV2进行卷积神经网络的回归模型预训练,然后采用MobileNetV2的训练模型进行多标签图片的特征提取可以减少分类模型的所占大小,采用可解释的集成模型改造成多输出回归结合阈值选择可以完成多标签分类任务。经仿真发现,轻量化复合网络可以达到和单模型一样的预测精度,但是模型大小比起单模型小的多,且预测时间要快。(3)提出了resnet50特征提取网络和Light GBM回归算法的网络结构,针对多标签模型分类准确率不高的问题,对resnet50网络优化其网络结构引入了全局平均池化层和全连接层,可以提取到更好的特征,采用训练好的改进resnet50模型进行特征提取改造,采用Light GBM模型进行多标签分类。仿真后发现,该网络有非常好的分类准确率,复合网络结构比起单模型预测精度高出3.7%,可以看出复合模型在多标签分类中具备很大的优势。
其他文献
本文提出构建一个适用于各大科研院和科研机构使用的科研管理系统,实现目标在于为科研管理人员和科研人员提供信息化且智能化处理科研项目和科研论文的平台。该系统开发基于Java EE框架开发,将系统划分为业务逻辑、数据库层以及界面层三部分,客户通过浏览器界面访问系统,使用My SQL数据库存储系统数据信息针对当前的科研管理系统存在的缺乏交互性等问题,能提出好的解决方案。然后针对复杂的角色权限控制,能够梳理
某型无人机是一种中空、长航时多用途无人机,其配套的一线维护设备——综合维护检测设备在无人机放飞前、飞行后地面检查及日常维护中使用非常频繁,综合维护检测设备用以测试无人机飞管系统、机电系统等,功能种类多。综合维护检测设备的生产调试、验收测试、故障排查目前测试方法过程繁琐且与科研工作产生较大冲突,但通用的测试方法无法满足综合维护检测设备的测试需求。因此,决定开展综合维护检测设备专测台的研究。本论文描述
肺癌是当今世界上死亡人数最多的癌症,由于多数患者发现时已经是中晚期,后续生存率不高。如果能够早期做出有效诊断并加以积极治疗,5年内的生存率可提高到54.4%。所以,提高生存率的主要举措就是早发现早治疗。肺癌早期的临床症状不明显,肺部病灶以肺结节的形式出现,CT影像成为医生诊断肺结节的主要工具。与X光胸片相比,CT检查可以获得肺部更多的细节图像,与此同时也给医生带来了很大的工作负担。为了能尽早发现肺
近年来,互联网资讯内容成爆炸式涌向人们的日常生活,各种平台、服务夜以继日地生产着资讯内容,行业对于互联网资讯的可溯源性需求也逐步转变为信息追溯的安全、可靠和高效性。同样的,互联网海量的信息当中又有相当一部分内容是相似的甚至是重复,归根结底还是因为如今互联网平台繁多,各自之间又数据不通,形成数据孤岛,造成了大量的资源浪费。总的来说就是互联网资讯领域缺乏统一的规范化管理,所以本论文旨在通过研究一套新的
如今,随着智能车辆的增多,城市车联网的规模越来越大,这使得车辆在行驶过程中,能够为驾驶员和乘客提供随时随地的信息访问。与此同时,网络中的通信用户对城市车联网安全的要求越来越高。由于车联网中车辆节点移动的随机性,网络拓扑的时变性以及通信环境的复杂性,城市车联网面临众多安全问题,主要存在的问题有以下两点。一是在存在多种网络攻击的情况下,难以保证车辆节点身份识别的准确性;二是车联网在向用户提供云计算服务
随着我国改革开放事业的深化发展,我国的工业化成果硕果累累,各种高端装备不断推陈出新,装备的性能指标不断提高,国产化率不断提升。近年来,在信息技术领域,国产的软硬件项目百花齐放,取得了很大的进步。但是,我国在高端芯片和基础软件领域仍然和国外存在不小的差距,甚至受制于人。尤其是近两年美国对我国发起贸易战,限制我国的企业、高校和其他科研单位的发展,带来了巨大的经济损失。在这个背景下,国内科研院所和科技企
区块链技术近几年发展迅速,早期的区块链应用都是公有链,承载了大量可自由出入的节点,系统一般采用工作量证明等共识算法。采用证明类共识算法的系统一般每秒可处理交易数很低以及交易确认延迟很高,难以适应于需要高并发、低延迟的金融类区块链应用。另一方面,在以比特币为代表的公有链系统中,为了提高共识节点挖矿的动力,系统会给予挖到新区块的共识节点经济奖励,这样有利于区块链的不断延伸。经济奖励直接影响共识节点挖矿
随着无人机应用领域越来越广泛,国产无人机产品的更新迭代速度也越来越快,导致其研制周期时间越来越短,而在整个研制周期中软件测试阶段所占的比重日益增大。其中,配置项测试是非常关键和耗时的一环,如果能有效地减少该项的测试时间,对于缩短整个产品的研制周期有很大帮助。本课题的主要目的是设计和实现无人机飞控软件配置项测试软件。本文首先对于国内外飞控软件测试方式进行了研究,介绍了软件开发中使用到的Eclipse
随着智能交通的不断发展,车载自组织网络在提高道路安全、实时数据收集、自动化控制、智能收费、增强导航以及一些特定的位置服务、音视频传输、娱乐服务、车内办公等各方各面都发挥着至关重要的作用。然而由于车辆的快速移动性,车载自组织网络的拓扑和网络情况会时刻发生改变,导致其路由存在两个方面的问题:一是在单播路由情况下,车载自组织网络的动态变化性易导致网络环境复杂,消息传输时延增加,同时车辆的快速移动性会造成
文本信息是图像中的重要线索,检测图像中的文本是智能信息处理的重要课题之一。传统的文本检测任务通常是用来提取文档图像中的文字。因为文档的背景一般比较干净、没有复杂的纹理信息,文本信息提取往往比较简单,然而在自然场景下,文本提取的难度往往远大于此,一个原因是它的背景非常丰富,例如街道、植被、楼宇等,另外文字的展现形式也是各种各样,艺术字、变形字、多语言混合、残缺字、光影遮蔽等,而且自然场景图片的质量往