基于流形学习的图像颜色迁移及可视化算法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hutuxiaoshenxian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高光谱成像仪能够获得由几十到几百个连续密集的窄波段组成的光谱图像。高分辨的光谱信息使得目标检测和分类变得更加准确,因此高光谱图像在农业和矿业勘探等领域得到广泛应用。然而,由于一般的显示屏最多只能显示三通道的图像,因此高光谱图像无法在显示屏上直接显示。为了获得用户与高光谱图像之间的高效交互,高光谱图像的可视化问题成为一个研究热点。高光谱图像可视化本质上是一个降维的问题,其目标是把图像从高维空间转换到RGB三维彩色空间。一般而言,高光谱图像的可视化方法应尽量实现以下目标以方便人理解和分析图像:1,信息保留;2,颜色一致性;3,拥有自然色调。目前大部分方法都致力于解决信息保留的问题,即尽可能地在输出图像中保留原始图像的结构信息。然而,很多方法忽视了第二和第三个目标。比如,在大部分数据驱动的可视化方法中,相同的物质在不同的图像中可能会被差异很大的颜色来表示。另外,大多数方法最终都以不自然的伪彩色图像来显示高光谱图像。  为了使高光谱图像更容易被理解,本文提出基于流形学习的可视化方法,其目的是在保留图像信息的同时用自然的颜色显示高光谱图像。其核心技术是利用流形降维的方法把高光谱的波段数目降至三维,以此保留原始图像的结构信息,同时利用一张与高光谱图像对应的彩色RGB图像,在降维的同时把RGB图像的颜色迁移到高光谱的可视化图像中,最终得到一张易于理解的自然颜色的图像。本论文的主要工作和创新点如下:  1.提出基于流形对齐的高光谱可视化方法。流形对齐的核心思想是利用不同的数据集之间的对应样本,将多个数据集同时映射到一个共同的子空间。在这个子空间中,数据集之间的对应样本彼此对齐,原本用不同特征表达的数据集以一种共同的特征来表达。基于此空间,不同的数据集的原始特征可以相互转化,数据集之间的信息可以实现共享。在高光谱可视化的应用中,我们利用一张和高光谱图像对应的高分辨率的自然颜色的RGB图像,将其与高光谱图像通过流形对齐映射到一个共同的三维空间。这个空间作为连接高维光谱空间和RGB空间的“桥梁”,使得RGB图像的颜色和空间信息能够和高光谱图像的结构信息相融合,最终得到一张具有自然颜色信息和精细细节信息的可视化图像。  2.提出基于半监督流形学习的高光谱可视化方法。利用高光谱图像的流形结构和一个参考RGB图像的自然颜色信息来生成一张可视化图像。将高光谱图像中与RGB图像匹配的点看做带标记样本点,标记信息是RGB图像中对应像素点的颜色信息。用带标记样本点来约束可视化图像的像素点与它们在参考RGB图像的匹配点有相似的颜色。同时,利用高光谱图像中带标记和不带标记像素点,构建高光谱图像的整体流形结构,使得在流形结构的约束下,颜色从带标记点平滑地传播到可视化图像的其余像素点,同时保持高光谱图像的结构信息。在构建流形结构的过程中,本文采用空-谱结合的核函数以更好地保留图像的空间信息。提出的半监督流形学习可以在两个层面实现:实例级和特征级。实例级学习建立实例之间的联系:它直接得到高光谱图像中的像素点在三维颜色空间中的坐标。特征级学习建立不同特征之间的联系:它建立从高维光谱空间到三维颜色空间的线性映射。两种学习方式各有利弊。实例级学习是非线性的,可以保留高光谱图像的非线性结构信息,然而其学习结果难以推广到新的测试数据。特征级学习虽然是线性的,但其学习结果可以被直接用于其他由相同成像仪拍摄的高光谱图像,而且相比于实例级学习速度更快。  3.提出基于流形对齐和半监督流形学习的彩色图像颜色迁移算法。将RGB彩色图像的颜色迁移到高光谱图像的方法同样适用于普通彩色图像之间的颜色迁移。本文用提出的流形对齐和半监督流形学习的方法解决彩色图像拼接问题中的颜色不匹配问题。在全景图像拼接过程中,待拼接图像可能因为拍摄时间,光照,相机参数等不同导致图像颜色不一致,从而导致拼接后的全景图颜色不一致。颜色迁移是最常用的一种解决颜色不匹配的方法。在颜色迁移的模型中,通常将颜色较满意的一张图像称为参考图像,而将颜色待改变的图像称为目标图像。颜色迁移的目标是合成一幅新的图像,使其同时具有参考图像的颜色和目标图像的形状结构等信息,即目标图像在不改变它自身所表达的形状信息的情况下,学习参考图像的整体颜色基调。本文分别利用提出的流形对齐和半监督流形学习的方法进行颜色迁移,最终得到全局颜色一致的全景图像。
其他文献
两相流动过程广泛存在于石油、化工、冶金等工业领域,其特征参数的检测对于资源合理开发和工业过程控制均具有重要意义.石油混输系统中,形成油气两相流、油水两相流或油气水
搜索引擎作为Internet上最主要的信息检索工具,在各个领域都已得到广泛应用.然而,由于网络信息量的迅猛增加和网络信息组织的无序性,传统搜索引擎的信息检索技术已经无法满足
笔式界面是飞速发展的Post-WIMP界面的主要形式之一。笔式界面是基于识别的界面,笔划是主要数据类型,由笔划组成的数据符号和命令符号的基本处理方式是识别,高识别率是大多数笔
自动指纹识别技术以生物技术为基础,以信息技术为手段,将生物特征和信息这两大热门技术结合为一体,其发展前景广阔,具有很高的实用价值和理论研究价值。本文是参与导师的课题“基
随着金融领域信息化的发展,金融机构积累了大量的数据.中国的证券市场成立十几年以来,股市的各种数据也日益增多.而激增的数据背后隐藏着许多重要的信息,人们希望能够对其进
学位
聚类是数据挖掘中的一个重要研究领域,它所解决的问题是将已给定的若干无标记的模式聚集起来使之成为有意义的类.该文首先在吸取国内外聚类算法的精华的基础上又对它们进行改
近年来,移动互联网的快速发展以及智能移动终端的迅速普及使移动互联网用户数量急剧上升,并且越来越多的用户使用手机等移动终端访问互联网,同时互联网上的程序也逐渐应用在
癫痫是我国第二大神经疾病,由大脑病变部位的神经元异常放电导致。癫痫发作时,通常表现为运动、感觉、意识等神经功能紊乱,对患者的生理和心理造成巨大痛苦和伤害。目前,我国大约
该文对视频编码中的关键技术-熵编码技术进行了研究,针对高清晰度视频提出基于上下文的2D-VLC熵编码器.H. 264/AVC标准是正在制订中的新一代视频编码标准,包含了非常先进的编