图模型的局部学习与非参数协方差矩阵模型

来源 :北京大学 | 被引量 : 0次 | 上传用户:luoxing1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要探讨图模型的学习问题。对于有向无环图的局部学习问题,提出了POLSL算法;进而探讨了当连续型数据服从非高斯分布,变量间有非线性关系时学习图模型如何作检验的问题;非参数协方差矩阵模型可以视为一类拓展的图模型的前身,即随着一个指标变量的变化而协方差矩阵随之变化的模型。   对于有向无环图的局部学习问题,假设在一个大的因果网络中需要对某个目标变量进行预测,并且预测是在测试集上有外部干预的情形下进行的。本文提出两个算法并统称为部分定向局部结构学习算法(Partial Orientation and LocalStructure Learning,以下称POLSL)。它包括Local—Graph算法和PCD—by—PCD算法(这里PCD代表父节点(Parents]),子节点(Children)和后代节点(Descendants))。使用POLSL算法可以学习出来目标变量的局部结构并部分定向一些边而不用把整个因果网络构造出来。Markov等价类中能定向的边该算法都可以定出向来。这样就可以极大地将结构学习的计算量降下来并提高统计检验的功效。对于存在外部干预和不存在外部干预的不同情况,采取不同的策略选择变量集来建立预测模型。这里使用的是带有L1惩罚的logistic回归模型来作预测。   图学习的算法大体上可以分为两类:一类是constraint—based,一类是score—based。对于constraint—based类型的算法,不可避免要作条件独立性检验。但当条件集包含的变量很多时,样本量往往不足,使得检验的功效很低或根本无法完成:面对连续型数据,人们常常假设数据服从高斯分布,但当该假设不成立或者变量间的关系是非线性时,用一般的高斯分布的条件独立性检验会产生很大的偏差。本文指出,当数据中有降维结构时,可以对条件集进行降维,然后在降维后的数据上作检验。本文还提出一种对于连续型变量的非参数的检验条件独立性的方法。结合这两种新方法,可以相应地提高这些非标准情况下作检验的功效。本文给出了一些模拟结果。   对于服从高斯分布的连续型数据,学习其对应的无向图等价于求它的协方差矩阵的逆。一般来说,给定数据只有一个固定的协方差矩阵。本文试图拓展这个概念,提出一类“变系数协方差矩阵”模型,即对于一个指标变量(index variable),协方差矩阵是这个指标变量的光滑函数(矩阵值函数),即条件协方差矩阵。历史上对条件方差的估计已有很多研究,本文对条件协方差矩阵提出了一个非参数模型。提出了相应的基于核函数的估计量,并详细研究了该估计量的渐近偏差、方差和渐近正态性质。最后应用这个模型在一个实际的数据集上作了分析,得出了很多有趣的结论。
其他文献
本文分为三章。在第一章中,我们介绍了随机环境中的一般跳过程的模型,给出了它可配称的充分必要条件并加以证明,第二章是本文的主要部分,介绍了随机环境中的生灭过程,给出了两种特
在小学英语课堂中,兴趣是学生能否学好英语的关键,激发学生学习英语的兴趣是小学阶段教学的一项重要任务。小学生的年龄特点是好奇心强、模仿性强、生性好动,集中注意力持续
在许多实际问题中,如经济学中的投入——产出问题,最终归结为解线性方程组Ax=b,而迭代法是解上述线性方程组的重要方法。用迭代法解线性方程组Ax=b时,很重要一点就是方程解的收敛
博弈论(对策论)由匈牙利数学家von Neumann于20世纪20年代创立。1944年,von Neumann和Morgenstern合著的划时代巨作《Theory of Games and Economic Behavior》的诞生标志着现代
记L=-△+V为Rd上的Hermite算子,d≥2,定义与Hermite算子相关的Riesz变换RLi=(()/()xi-xi)L-1/2.我们定义如下的双线性算子:B(f,g)(x)=(RLif)(x)(RLjg)(x)-(RLjf)(x)(RLjg)(x)这里
本文研究了有15个部件串并联工作的多状态口香糖生产可修复系统。  通过选取空间和定义算子,将模型方程转化成为了抽象Cauchy问题。然后证明了系统算子在定义域中是稠密的;通
本文使用了持续期分析的方法来检验中国股市是否存在理性投机泡沫。首先介绍经典的理性投机泡沫理论和McQueen&Thorley提出的持续期分析方法,得出如果股市存在理性投机泡沫,则
幼儿园作为幼儿在成长过程中吸收知识与行为教育的主要渠道,其教育的重要性可想而知.幼儿时期的孩童们在玩耍中学习知识,在幼师的引导下了解生活与自我探究学习的能力.可随着
空间数据模型和时空模型在许多领域都有应用:环境科学,天气预测和天文学,水文学和储水工程等等。有很多方法对空间数据进行处理,例如参数方法,半参数方法和非参数方法。为了
近年来,随着依靠投资驱动、出口贸易拉动经济增长模式的不可持续,消费作为拉动经济增长的巨大动力,自然是研究经济增长的重要方向。同时由于我国各区域的经济发展不平衡,尤其是东