基于Lasso的特征选择方法研究与实现

来源 :安徽师范大学 | 被引量 : 0次 | 上传用户:A403537889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域,特征选择作为数据预处理的一种常用的手段,不仅能够提高分类器的分类性能,而且能增加对分类结果的解释性,已被广泛的应用到图像检索、人脸识别、医学图像分析等领域。但随着时代发展和科技的进步,各应用领域积累了大量的高维数据,包括有标签数据和大量无标签数据,应用传统的特征选择方法于处理这些数据时具有一定的局限性。基于全监督机器机器学习,充分挖掘数据自身所具有的先验知识,提出了新的特征选择方法,并将其推广到半监督机器学习场景,从而更好利用大量无标签数据,学习出更具推广性的学习模型。具体而言,本文主要进行了如下研究工作:  首先,在全监督机器学习环境下,针对Lasso特征选择方法的不足,提出了一种新的特征选择方法 Lap-Lasso,保留了基于 Lasso特征选择方法的优点,即:能够进行回归和特征选择,选择出的特征与类标签非常相关,同时又考虑到了样本自身内在的关联信息,以诱导出更具有判别力的特征。通过理论分析和仿真实验,在UCI数据集的实验结果验证了Lap-Lasso方法的有效性。进行特征选择时,相比其他的特征选择方法表现出更好的性能。  其次,考虑到在应用实践中,通常获得有标签数据通常需要大量的人力物力,而获得无标签数据相对较为容易,本文将Lap-Lasso模型推广到半监督机器学习场景,提出了半监督特征选择方法Semi-Lap-Lasso方法,在UCI数据集上,一系列实验验证了该方法的有效性。  最后,在 UCI数据集上,一系列实验验证了 Semi-Lap-Lasso方法的有效性。
其他文献
集装箱装载是指将具有一定体积、重量、价值的不同种类不同数量的货物合理高效地放置到一个具有体积载重等限制的集装箱空间内的过程。装载作为物流供应链中的重要环节,其效
几年来社会生活中一直存在着这样一对尖锐的矛盾:一方面改革的实践急切地呼唤着理论的指导;另一方面改革的理论研究又大大落后于丰富多彩的改革实践。从事报纸理论宣传的同
随着丙、丁、戊、己醇的加入,与季铵盐二聚表面活性剂C12-2-C12@2Br组成了混合胶团,醇分子以烷烃链插入胶团中,羟基则位于胶团栅栏层处.这减弱了表面活性剂离子头基间的静电
20世纪90年代末期,为了扩大办报事业,我们加大了与周边同类报社的联系,一方面学习其办报经验,更重要的是探索一条如何改革的路子。我和戎海(编辑部主任)、志斌(广 In the l
众所周知,画出物体的运动轨迹草图是好的解题方法之一.它有助于学生清晰有序地了解物理过程和确立物理量间的关系,可以把问题具体化、形象化.解物理题过程中,学生要用轨迹图,
不久前,参加宝应县通讯报道培训班的部分基层通讯员,在县城第二招待所会议室里举行了一次《新闻通讯》评议会。大家你一言,我一语,都说《新闻通讯》贴近基层,通俗实用。泾河
随着数字技术的发展,国内外对图形图像输入设备的需求越来越广泛。其中大幅面工程扫描仪在国内外需求相比则更大,它主要用于实现军事、测绘、建筑等一些特殊领域工程图纸的数
高一物理是高中物理学习的基础,但学生普遍认为高一物理难学,第一个原因是初中物理与高中物理在衔接中出现的“高台阶”,第二个原因是学生能力与高中物理教学要求的差距大因
由中国农业科学院茶叶研究所派员参加的桂西山区作物种质资源考察队茶叶专业组,在1992年的桂南宁明、龙州、防城、凭祥、上思等地的考察中,接连发现野生茶树,其中地处中越边
随着计算机技术特别是网络技术的迅猛发展,计算机病毒的更新、传播速度越来越快,危害也越来越大。目前,病毒检测技术已经取得了很大的进步,但传统的病毒检测系统仍然存在一些缺陷