基于向量场的机器学习

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wmwanll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多机器学习问题中,我们往往要面对非常高维的数据。有一个很强的直觉是这些数据可能有一个低维的内在表示。很多研究者考虑了数据是从一个嵌入在高维欧氏空间中的低维子流形上采样得到的情况。因此,学习一个低维子流形结构,或者具体地说是数据流形的内在几何和拓扑结构,成为了一个重要的问题。大多数目前的工作是用图上的拉普拉斯算子来约束流形上预测函数的一阶光滑性。但是,除了一阶光滑性,在半监督学习和无监督学习问题中,我们应该要求函数具有两阶光滑性。我们指出函数的两阶光滑性度量了函数在流形上的线性性,而且一个流形上的线性函数的梯度场必然是一个平行向量场。为了解决表示、离散化和求解流形上的向量场等关键问题,这篇论文在向量场学习方面进行了系统的研究,包括理论分析,离散化和优化。本文的主要创新点包括:1.为了分开不同的连通分支,本论文提出了一个线性流形学习方法。我们对目标函数和约束条件进行了理论分析,我们的理论分析指出流形的仿射包和连通分支对于线性流形学习是至关重要的。在某种意义下,每个位于同一个仿射包的连通分支都会被最优投影投到一起。为了恢复流形结构,我们首先从局部等距和全局等距的讨论中得到平行向量场和等距映射之间的内在关系。我们发现寻找等距映射等价于寻找流形上的平行向量场。我们的理论分析表明,如果流形确实是跟欧氏空间中的一个连通子集等距的话,那么我们的方法可以准确地恢复出流形结构。2.为了在半监督学习中利用流形的结构,本论文对于半监督回归和多任务学习问题提出了基于向量场正则化的方法。最新的一些理论工作指出为了在半监督回归问题中达到更快的收敛速度,我们应该要求函数具有两阶光滑性。为了达到这个目标,我们指出函数的两阶光滑度量了函数在流形上的线性性,而且一个流形上的线性函数的梯度场必然是一个平行向量场。因此,我们提出寻找一个函数使得经验误差最小化,并且同时要求它的梯度场尽量的平行。我们在流形上给出一个连续的目标函数并且讨论如何通过离散的点去离散化这个目标函数。最终的离散优化问题变成了一个稀疏线性系统,它可以快速有效的求解。在多任务学习中,我们提出了一个新的多任务向量场学习方法,它会同时去学习预测函数和向量场。多任务向量场学习具有一下主要性质:(1)我们所求得的向量场是跟预测函数的梯度场接近的。(2)在每个任务里,向量场要求为尽量平行,这样我们期望它会张成一个低维子空间。(3)所有任务的向量场共享一个低维的子流形。我们将我们的想法化为一个正则化的框架,并且提出了一个凸松弛的方法去解决原始的非凸问题。3.为了学习流形上的测地距离函数,本论文从向量场的角度提出了一个新的方法。计算测地距离最简单的方法就是直接去计算两点之间的最短路径距离。但是,众所周知,计算逐对最短路径距离是非常耗时的,而且它不能处理非凸流形的情况。在本章中,我们在固定一个点p的时候研究测地距离函数d(p,x)。只要我们对于一个固定点p可以计算距离函数,那么我们可以通过变化p来求得距离函数d(·,·)。我们给出两个定理来精确地刻画这样的距离函数。我们的理论分析说明,如果一个函数rp(x)在点p的邻域处用指数坐标表示下是欧氏距离函数,而且函数rp(x)的梯度场几乎处处都是单位长度的话,那么rp(x)肯定是一个唯一的测地距离函数d(p,x)。基于我们的理论分析,一个新的基于向量场的方法被提出来进行测地距离函数的学习。具体地,我们提出去学习的函数在一个固定点的邻域内是一个欧氏距离函数,同时要求它的梯度场处处都是单位向量。
其他文献
本文首先从商品交易市场密度、市场规模等方面剖析了我国商品交易市场发展的省区差异特征,证实了市场密度、市场规模与国民经济发展水平之间存在着显著的相关关系;继而又从市
通过2个2×2实验,研究了代言人的3个属性,即代言人知名度、代言人国别和代言人参与度,对“中国制造”产品评价的影响机理,其中代言人知名度是调节变量.实验中的所有被试均为外
基于大量文献资料与本研究集体的相关研究 ,论述了当前整体煤气化联合循环系统 (IGCC)技术主要研究方向与进展 :传统研究方向的新进展 ,新颖的 IGCC热力循环系统 ,多联产与综
当前,语文教材中的选修篇目越来越多,且作品类型也不断丰富,这就要求教师必须具有更强的专业素质和更广的知识面,以及对不同文学作品的驾驭能力。针对如何把握高中语文选修课
应用经典的Strichartz估计和Green函数方法研究齐次非对称波动方程解的Strichartz估计.在得到齐次非对称波动方程解的Lp-Lq估计的同时,我们更进一步的给出了这类波动方程解在
在陇东半干旱地区,对新引进的优良紫花苜蓿(Medicago sativa)品种进行了2~3年的播种时期、播种密度和播种方式的试验。结果表明,1)不同播期中,秋播平均产量0.772kg.m-2,夏播0.
"四学课堂",即独立学、合作学、训练学、反馈学."四学课堂"理念给语文课堂教学带来了全新的改变,为了让每个学生都能更好地学习和发展,就必须给学生一个自由成长的空间,一个自我
哺乳动物季节性繁殖主要受褪黑激素调控,而褪黑激素的分泌受其2个合成酶HIOMT和AA-NAT调控.分布于青藏高原的藏黄牛和牦牛是典型的季节性繁殖动物,普通黄牛繁殖则季节性不明显.比