【摘 要】
:
随着三维设备的逐渐普及,深度学习中针对三维数据如体素数据、多视图数据和点云数据的研究应运而生,因此作为基于三维数据的感知任务中的关键技术——形状识别也成为了当前计算机视觉的研究热点之一。数据形式驱动研究方法,三维数据的激增鼓励了各种基于三维数据的深度学习方法。然而研究发现,体素数据在处理过程中需要考虑分辨率和算力等问题,多视图数据可能出现全局特征感知缺失和局部信息冗余的问题,至于点云数据使用最为广
论文部分内容阅读
随着三维设备的逐渐普及,深度学习中针对三维数据如体素数据、多视图数据和点云数据的研究应运而生,因此作为基于三维数据的感知任务中的关键技术——形状识别也成为了当前计算机视觉的研究热点之一。数据形式驱动研究方法,三维数据的激增鼓励了各种基于三维数据的深度学习方法。然而研究发现,体素数据在处理过程中需要考虑分辨率和算力等问题,多视图数据可能出现全局特征感知缺失和局部信息冗余的问题,至于点云数据使用最为广泛,虽然能够最大程度的保留样本模型的空间结构信息,但是数据本身无序、不规则且稀疏,无法使用传统的神经网络处理,并且在局部信息的感知方面不如二维图像。单一的数据类型难以打破自身局限性,因此需要对多源数据信息进行融合以得到更加优异的特征表达,从而提升整体网络的识别精度。针对以上问题,本文选取了较为流行的两种三维数据——点云数据和多视图数据,以此为基础,研究更为优秀的数据特征提取算法,并且提出了一种基于多模态注意机制的融合网络。具体而言,本文以数据特征提取和多模态特征融合这两大关键技术为研究点,利用新兴的图神经网络和注意力机制,构建了端到端的三维形状识别网络模型,并且在针对每一类数据的研究中不仅提出了新的特征提取算法,还搭建了可以进行形状识别的端到端的网络模型,最终在公开的标准数据集上分别对以上模型进行了验证。本文主要完成了以下三方面工作:1.针对在点云数据的特征提取过程中局部特征不够细粒度化、识别网络精度较低的问题,本文提出一种引入图注意力机制的三维形状识别网络。该模型使用了基于样本感知的数据增强策略,在GAPNet(Graph Attention based Point Neural Network)模型基础上,通过本文提出的顶点和邻域关系的注意力关系模块——VNAM来深度挖掘三维点云中节点之间的深层隐含关系。该特征提取算法通过对节点之间的多级别注意力关系的提取,增强了网络的局部信息感知能力。本文将提出的网络模型在国际公开的标准数据集ModelNet40上进行了实验,结果证明,在本文的实验环境中该算法可以在不影响网络模型参数量的前提下,比GAPNet识别精度提升0.3%。在采用基于样本感知的数据增强策略后,本文的模型可再将精度提升1.2%,最终的模型识别精度在GAPNet的基础上提升了 1.5%。2.针对多视图数据特征提取过程中无法有效探索视图间的内在联系、识别网络精度低的问题,本文提出了联合卷积神经网络和图神经网络共同进行特征提取的算法策略,并搭建了端到端的三维形状识别网络。本文的网络模型摒弃了传统方法中直接将初步提取多个视图特征进行池化的做法,而是将每个视图特征构造成图结构中的节点,使用摄像机坐标差定义图结构中的边,通过图卷积神经网络进一步学习多个视图之间的隐性关系,从而使每个视图充分融合了邻域视图的特征。本文同样将提出的网络模型在标准数据集ModelNet40上进行了精度验证,实验结果表明该特征提取算法比传统方法的识别精度提高了 1.1%。3.本文发现,基于单一数据的识别网络模型精度提高不理想,分析后认为融合多模态的特征可以打破数据的局限性,因此针对点视图融合模型中多模态特征融合的问题,本文首次提出利用多种形式的注意力机制来融合多模态特征的端到端的网络模型。该模型具有兼容性,基于图注意力机制提取点云特征,采用软注意力融合策略解决多模态特征融合问题,最终通过多信息融合实现高精度的三维物体感知。实际实验中还采用早期融合(Early fusion)策略进行了多组对比实验,最终在ModelNet40数据集上的实验结果表明,软注意力融合策略的效果优于早期融合策略,并且本文融合模型的识别精度相较于上述单独使用点云数据和多视图数据的模型精度分别提升了 1.8%和3.5%。
其他文献
目的:探讨内隐公正世界信念对第三方惩罚的影响.方法:通过内隐联想测验筛选出高、低内隐公正世界信念被试,采用2(内隐公正世界信念:高、低)×5(提议公正性:90∶10、80∶20、70∶30、60∶40、50∶50)两因素混合实验设计,其中,内隐公正世界信念为被试间变量,提议公正性为被试内变量,因变量为被试自愿拿出的惩罚金额.结果:(1)内隐公正世界信念影响第三方惩罚,相比低内隐公正世界信念个体,高内隐公正世界信念个体第三方惩罚更多;(2)提议公正性影响第三方惩罚,提议越不公正,第三方惩罚越多;(3)内隐公
随着计算机科学技术的不断发展,虚拟现实(Virtual Reality,VR)技术以及增强现实(Augmented Reality,AR)技术的三维虚拟场景(3D Virtual Environments)已经广泛用于电商行业的AR试穿、虚拟看房、在线家装、网络游戏等各行各业。相比于传统的2D媒体,基于3D模型的三维场景可以让用户在完成更丰富交互操作的同时,获得更好地沉浸式的体验。高质量的三维场景
网络功能虚拟化(Network Function Virtualization,NFV)技术由于能大幅度降低运营商的OPEX和CAPEX,提升网络部署的灵活性、有效性,缩短部署时间,被认为是未来网络的一种革命性技术。虚拟网络功能(Virtual Network Function,VNF)作为NFV架构中重要的组成部分,极大地提高了网络的动态性和灵活性,但是同时也给管理和部署VNF带来了巨大的挑战。
目的:对学校归属感(Psychological Sense of School Membership,PSSM)量表进行中文修订,检验其在中国中小学生中的信效度及其跨性别、跨年级的测量等值性.方法:应用中文版学校归属感量表对湖南省25所中小学三至十二年级4628名学生进行施测;以特拉华校园氛围量表(学生卷)(Delaware School Climate Scale-Student,DSCS-S)、病人健康问卷抑郁量表(Patient Health Questionnaire-9,PHQ-9)为效标工具检
目的:考察中文版牛津功利主义量表(Oxford Utilitarianism Scale,OUS)的信度和效度指标.方法:对597名中国被试施测翻译后的中文版OUS量表,选取外显功利主义观念、“牺牲”道德困境、精神病态量表、共情关注量表、认知需求量表、捐赠态度问卷作为效标量表.结果:①量表的各个项目具有良好的区分度,各项目得分和总分相关在0.42~0.83之间;②通过探索性因素分析得到无偏利益和工具性伤害2个因子,累积方差贡献率为53.72%;③验证性因素分析表明,两因子模型的拟合指数良好(x2/df=-
目的:检验行为情绪调节问卷(Behavioral Emotion Regulation Questionnaire,BERQ)中文版在我国青少年群体中应用的信效度.方法:对2900名初、高中学生施测,选取抑郁焦虑压力量表(DASS-21)进行效标效度检验.结果:量表各条目具有良好的同质性和区分度;探索性因素分析结果支持BERQ具有寻求分心、退缩、主动接近、寻求社会支持和无视5个维度;验证性因素分析结果表明BERQ五因子模型拟合良好,各条目因子载荷在0.59~0.89之间;退缩和无视与DASS-21显著正相
目的:了解在新冠肺炎疫情期间青少年手机等电子产品成瘾现状,并探究父母焦虑/抑郁影响青少年手机等电子产品成瘾的内部作用机制.方法:采用焦虑自评量表、抑郁自评量表、亲子冲突量表、亲子亲合量表和手机等电子产品成瘾量表对1561名初一-高三学生及其父母进行问卷调查.结果:(1)疫情期间,青少年手机等电子产品成瘾检出率为16.5%.(2)父母焦虑、父母抑郁、亲子冲突、青少年焦虑、青少年抑郁、青少年手机等电子产品成瘾两两变量之间均呈显著正相关,亲子亲合与其他变量之间均呈显著负相关.(3)父母焦虑/抑郁不直接预测青少年