【摘 要】
:
随着计算机技术的飞速发展,现实生活中存在的多种形态的大规模数据成指数级增长。如何对海量、稀疏、低秩、含噪声的数据进行快速有效地处理,进而从中提取出对人们有价值的数
论文部分内容阅读
随着计算机技术的飞速发展,现实生活中存在的多种形态的大规模数据成指数级增长。如何对海量、稀疏、低秩、含噪声的数据进行快速有效地处理,进而从中提取出对人们有价值的数据信息,是统计学与计算机科学等相关领域的研究工作者普遍关注的问题。数据低秩约束是一种普遍存在的现象,如何在低秩约束的前提下进行数据处理成为近年来研究者关注的焦点问题之一。本文从低秩约束出发,分别研究了数据的分类问题和特征分析问题。具体而言,本文的主要研究内容如下:1.分析总结了低秩约束的相关理论。对国内外已有的关于低秩约束理论的发展和研究现状进行了细致地总结、分类,对三种主要的低秩约束理论(包含低秩矩阵恢复、低秩矩阵补全以及低秩矩阵表示)及其算法做了详细的阐述和分析。2.在低秩约束的基础上,提出了一种新的数据分类方法。针对数据的低秩特性,提出了一种基于非负矩阵分解和调和函数的数据分类学习方法。在对非负矩阵分解理论的基本原理和调和函数性质的深入分析基础上,将非负矩阵分解理论和调和函数融合在一起进行数据分类。在实际数据上与传统的分类方法进行对比实验,得到满意的实验结果。3.在低秩约束的基础上,提出了新的数据特征分析方法。从低秩约束理论出发,提出了一种基于邻域保持嵌入和稀疏正则化的数据特征分析方法。深入分析了邻域保持嵌入方法和稀疏正则化的性质,在邻域保持嵌入方法的基础上引入关于稀疏的L2,1正则项,对数据进行特征选择。文中做了大量的实际数据比对实验,与传统的特征选择方法比较,结果表明该方法在某些性能上具有优势。
其他文献
复杂网络是介于规则网络与随机网络之间的含有大量节点的网络模型,自1998年第一篇开创性的论文发表于Nature以来,复杂网络方法已在生物、社会、经济、技术等各个领域得到广泛
自适应群团抽样方法是一种对观测目标进行自适应抽样的方法。它利用了观测目标稀有且呈聚集分布的特点,比传统的抽样方法有更高的效率。这种方法通过给定参数,将总体唯一地划分
本文定义了Gibbs系数,用来在一定的意义下测量Gibbs现象。之后,以一些经典的三角多项式序列为例,计算了Gibbs系数。
本文是基于中国-香港,芬兰和美国在国际学生评价项目(PISA)第二次测评(PISA-2003)中的数据对学生的数学能力进行分析.首先,用多水平模型对这三个国家和地区学生的数学成绩进行
[目的]对水稻SDG711蛋白C末端进行原核表达,并制备其多克隆抗体。[方法]选取水稻SDG711蛋白抗原决定簇较密集的C末端进行原核表达,通过构建原核表达载体pET28a-711C,转化E.co
什么是美,美就是和谐,就是主观和客观的和谐统一.生活环境和谐美丽可以提高人们的生活质量和工作效率.作为教学的主阵地——课堂,同样也呼唤美.科学课程标准指出:科学课程内
本文利用GroSbner-Shirshov基研究两类非结合代数,即反交换代数和Akivis代数。全文由两章组成。 第一章给出了自由反交换(非结合)代数的合成钻石引理。利用这个引理得到了
本文通过统计分析与实证研究的方法调查高校青年学生对于志愿服务活动的参与与认知情况,据此分析基本特征,考查学生对于“服务性学习”的认知情况,并提出针对性的建议.
尽管从世界经济的角度来衡量,世界贸易自由化有利于全球生产力的提高,但是传统的世界贸易理论并未关注到:贸易自由化的过程既然是一个实现世界经济布局的最优化的过程,也必然
投资组合问题是指将可供投资的资金分配于多种证券上,以使不同类型的投资者寻求所能接受的收益和风险相匹配的最适当、最满意的证券组合。由于衍生证券在投资组合中的地位越