基于多视图的无监督子空间聚类算法的研究与应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:chppxhn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息获取技术的进步,多视图数据变得无处不在,我们可以轻松地从异构特征空间获得具有多视图表示的数据。多视图聚类旨在利用多个视图间互补的信息和一致的信息来发掘数据中的固有结构。这类算法具有广阔的应用场景,如计算机视觉、自然语言处理、社交多媒体等等。因此多视图聚类在机器学习和数据挖掘领域受到越来越多地欢迎。虽然近年来已经提出了不少多视图聚类算法,并在特定领域取得了不错的效果,但是现有算法仍存在着一些不足。多视图数据往往存在缺少标签信息、数据不完整或者具有噪声的问题。为此,我们提出一种联合特征选择和自表示学习的算法,并将其扩展为一种鲁棒的多视图子空间聚类算法,该算法利用理想的子空间结构学习一致的亲和矩阵。具体来说,该算法从不同视图的数据中学习一致图,该一致图由块对角自表示矩阵编码且具有恰好k个连通分量(k是集群的数量)。除此之外,我们强调对于损失函数的L2,1范数最小化以减少冗余特征和不相关的特征,并隐式地为每个视图分配自适应权重,而无需引入其他参数。最后,推导了一种交替优化算法来求解非凸的目标函数。在合成数据和实际数据集上的大量实验结果表明,我们的方法始终优于其它代表性的多视图聚类方法。多视图数据不一定符合线性子空间分布并且现有的多视图聚类算法大多仅考虑一致性或不同视图的多样性。为此,我们提出了一种深度多视图子空间聚类算法,该算法通过自编码器将多视图数据非线性地映射到一组潜在空间。更重要的是,我们引入一个自表示层来学习多个视图共享的一致表示和一组每个视图特定的表示。具体而言,一致的表示可建模所有视图之间的通用属性,而特定的表示则可捕获每个视图中的固有差异。对四个基准数据集的实验结果表明,与几种最新技术相比,该方法具有更好的性能。通过将算法研究与实际应用相结合,我们设计并实现了一个基于聚类算法的分析系统。该系统主要包括三个部分,分别为主界面模块、数据可视化模块以及聚类算法模块。通过该聚类分析系统,可以更加直观地了解实验数据集,以及执行相关聚类算法并对结果进行可视化显示。
其他文献
激光雷达凭借其角分辨率高、测距精度高等优点,在军事和民用领域有着广泛应用。与传统激光雷达不同,光子计数激光雷达以工作在盖革模式下的雪崩光电二极管(GmAPD)为核心光电检测器件,对远距离目标、弱回波信号的探测能力更强,是实现目标三维信息感知的重要手段。传统的点云数据处理方法在信噪比较低或目标反射率较低时,无法有效完成三维图像重建任务,为了弥补上述不足,本文深入研究了光子计数激光雷达的工作原理,以光
区块链作为一种新兴的分布式存储技术,能够实现数据的多方共享与维护,为数据共享提供安全、可信的环境。然而,随着近年来区块链研究的逐步深入,其自身的安全问题日益显露,区块链数据隐私保护逐渐成为热门的研究课题。联盟链Hyperledger Fabric(以下简称“Fabric”)作为最广泛应用的区块链平台之一,采用授权的方式限制节点访问数据,但在数据存储机密性和隐私性上缺乏合适的解决方案。本文针对Fab
雨是现实生活中非常普遍的天气,不仅影响人类的视觉,而且还会严重影响户外视觉系统的性能,包括视频监控,物体检测和自动驾驶等等。随着计算性能的提高以及深度学习理论的发展,图像去雨任务已经取得了许多突破性的进展。但是同样存在背景模糊、雨痕残留等问题。本文对现有的图像去雨方法的优缺点以及适用范围进行总结。针对现实场景下的图像去雨问题,本文重点研究了雨痕图像的特点,提出了基于分解的循环生成式对抗网络的图像去
非接触心率检测算法存在较为成熟的体系框架,通过摄像头采集目标面部信息,完成不接触待测者便能获取心率特征的任务工作,能够在较大程度上解决传染性病人、行动不便的患者、老人与婴幼儿的健康监测,同时也能作为情绪分类评估的指标,具有一定的研究价值。然而大多数的框架任务研究的内容偏向于微动、静止一类的情况,本文旨在建立剧烈运动状态场景下的心率监测的有效框架。(1)在原始ROI亮度信息采集的基础上,额外获取五官
随着移动互联网技术的快速发展和智能手机的大量普及,利用智能手机进行毒品交易、传播网络谣言,电信诈骗等犯罪行为日益猖獗。面向智能手机的数字取证可以有效地帮助司法部门收集犯罪证据。在所有的智能手机平台中,Android系统凭借其开源性和功能多样性等特点,占据了市场的主导地位,因此,针对Android智能手机的取证技术研究具有重大现实意义。由于Android生态环境的开放性,导致Android移动设备的
图像检索作为一项互联网信息处理的重要任务,面临着海量数据带来的挑战。传统的检索方法根据关键字检索,在处理海量图像数据时并不适用,为了解决这个问题,提出了基于内容的图像检索方法。在基于内容的图像检索技术中,图像内容的表达和相似性度量由计算机进行自动的处理,相比较采用文本进行图像检索所面临的缺陷,充分发挥了计算机长于计算的优势,由此大大提高了检索的效率。哈希检索方法是其中的代表性算法,它将图像以二进制
目标跟踪是计算机视觉领域的一个基础的、重要的且极具挑战性的研究方向。近年来,随着计算机硬件的高速发展以及性能优异的算法研究成果的出现,目标跟踪技术在商业、医学、军事等领域发挥着越来越重要的价值。然而由于目标被遮挡、目标发生形变、环境光照变化、背景中存在与目标相似的物体等干扰因素的存在,目前的算法在复杂场景下的跟踪表现并不理想。因此,本文针对复杂场景下的高鲁棒性目标跟踪问题,从基于相关滤波框架的跟踪
近年来,随着三维激光扫描仪以及低成本传感器的普及,使得三维点云数据可以更加快速且容易地获得。三维点云数据具有简单、灵活和强大的表示能力,现如今三维点云模型的应用越来越广泛,例如机器人、增强现实、自动驾驶、智能制造、计算机艺术等。然而,由于扫描设备自身精度不够等原因,通过扫描得到的点云数据不可避免地包含大量的噪声点,因此点云去噪成为下游应用的基础和挑战。为此,本文以散乱点云为研究对象,从局部与非局部
反射阵列天线由于具有成本低、重量轻、易于加工、可波束扫描等优点被广泛应用于卫星通信和雷达系统中。本文主要围绕反射阵列天线进行研究,主要包括两种新型宽带反射阵列天线的设计,低剖面折叠反射阵列天线的设计及其结构简单且低成本的波束扫描方法的实现。本文的主要工作内容如下:1、设计了一种基于单层偶极子加载T-形支节单元结构的宽带反射阵列天线。首先设计了一个中心频率为10 GHz的角锥喇叭天线,作为反射阵列天
数字阵列雷达是阵列雷达中一种重要的新体制雷达,能够形成多个波束实现全方位扫描。圆柱阵雷达作为数字阵列雷达的一种形式,具有全方位多波束、高数据率的特点,这对信号处理提出了很高的要求。目前主要以FPGA和DSP作为常用的雷达信号处理平台,但由于其开发成本高、调试周期长、程序可移植性差,造成其更新换代困难。分析圆柱阵雷达信号处理流程发现,其信号处理过程中存在大量并行计算,而GPU在通用并行计算领域优势明