【摘 要】
:
二十一世纪已迎来了大数据时代,数据包含的变量个数越来越多但同时冗余的信息也越来越多.统计学习或者机器学习从这些数据中学习越来越困难,因此在建立模型前进行变量选择非
论文部分内容阅读
二十一世纪已迎来了大数据时代,数据包含的变量个数越来越多但同时冗余的信息也越来越多.统计学习或者机器学习从这些数据中学习越来越困难,因此在建立模型前进行变量选择非常必要.多变量函数的梯度每个分量是函数关于这个位置变量的偏导数,范数大小相应的代表了对应位置变量发生变化时因变量发生变化的程度.梯度估计在变量选择问题中起着重要的作用,因此本文主要研究从样本点学习梯度. 本文提出了一种基于系数正则化的高维空间梯度估计算法.与传统梯度估计算法相比,该算法无需对变量所在的区域进行剖分,可以有效的用于高维空间.并且我们的算法直接对梯度进行估计,而不是先对从样本点学习函数到求导得到梯度估计.因此该算法更加的直接有效.我们给出了该算法的表示定理,将复杂的优化问题转化为简单的线性方程组问题求解.此外,借助于奇异值分解,我们还讨论了如何有效地降低表示定理中矩阵的规模.并给出了降维后的误差分析和降维算法.使得算法能够更快速的求解.在本文最后的部分,我们通过两个数值例子来验证基于系数正则化的梯度估计算法的有效性.第一个例子是模拟数据,验证我们的算法可有效用于变量选择和变量相关性研究.同时,第二个数值例子选取空气质量监测数据,算法得到的结果符合我们日常的认知,进一步说明我们的算法是有效可行的.
其他文献
老板接到一桩业务,有一批货要搬到码头上去,又必须在半天内完成.任务相当重,手下就那么十几个伙计.rn这天一早,老板亲自下厨做饭.开饭时,老板给伙计一一盛好,还亲手捧到他们
在不变式理论中,模情形下transfer理想的结构是一个重要的问题.本文研究了模情形下最小阶非交换p-群(p ≠ 非亚循环群P的transfer理想以及其不变式的一些性质.令Fq是特征为p(≠ 2)的有限域,V_4是非亚循环群P在域Fq上的4维表示空间.我们通过寻找向量空间V_4的对偶空间V_4*的一组Dade基证明了不变式环Fq[V_4]P是多项式代数,并证明了余不变式环Fq[V_4]P不是正则
[目的]了解黄芩Scutellaria baicalensis Georgi种子萌发过程中的初生与次生代谢规律。[方法]超氧化物岐化酶(SOD)活性测定采用核黄素-NBT法,过氧化物酶(POD)活性测定采用愈
本文主要利用像空间分析研究了约束极值优化问题与广义向量拟平衡问题的强、弱择一性定理和最优性条件及其在向量交通网络均衡问题上的应用,并讨论了弱向量变分不等式的间隙
扩散过程起源于物理学,之后引起数学学者们的广泛关注,一直以来是随机分析方向的前沿和热点。如何延续这种扩散过程和其它领域的有机结合,体现交叉效用,拓展扩散过程理论的研
盲源分离(Blind Source Separation,简记为BSS)指的是在未知源信号分布和它们的混合方式的环境下,只是根据观测到的混合信号,就能分离出源信号的过程。独立成分分析方法(Indepen
北电网络公司的员工考核要分为两个方面,一方面是员工的行为(Behaviors),另一个是绩效目标(Performance/Outcome).每个员工在年初就要和主管定下当年最主要的工作目标是什么.
在遥感图像的道路特征信息提取过程中,特别要考虑对图像的滤波问题,这是因为在获取和传输遥感图像的过程中,非常容易受到各种不同噪声源的干扰和影响,而噪声的存在会给图像的读取