半监督学习方法及其应用研究

被引量 : 0次 | 上传用户:sayaka66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,人类收集数据、存储数据的能力得到了极大的提高,无论是科学研究还是社会生活,各个领域中都积累了大量的数据,对这些数据进行分析以发掘数据中蕴含的有用信息,几乎成为所有领域的共同需求。传统的机器学习方法大多只考虑有标记数据(labeled data)或者未标记数据(unlabeled data),但是在很多真实问题中往往是二者并存的。半监督学习(Semi-supervised learning)由此应运而生。半监督学习是模式识别和机器学习中重要研究领域之一,一直为国际机器学习界关注,其在分类(classification)和聚类(clustering)中得到了广泛的应用,本文主要针对半监督聚类进行研究和分析。本文首先对于半监督聚类领域的国内外研究情况进行回顾,然后通过对无监督聚类和监督学习理论知识的介绍,得出半监督聚类为何会得到广泛关注,同时给出半监督聚类常用的思路和算法。最后本文详细介绍了我们在这方面研究开展的一系列工作:(1)我们提出了改进微分进化算法的半监督模糊聚类,在结合传统FCM和进化算法的基础上,参考粒子群算法惯性权重思想,引入惯性加权系数。算法前期可以维持个体的多样性,后期能够加快算法的收敛速度,有效地提高了算法的性能。遥感图像数据等实验结果证明了算法的有效性。(2)我们提出了基于改进的成对约束的半监督聚类算法,首先对原先少量约束对信息进行调整,增加约束对量。在此基础上利用监督信息对原始数据进行降维,利用闭包中心代替闭包集,最后在基于成对约束的K均值算法上进行聚类。该算法解决了成对约束的违反问题,同时提高了聚类的性能。在UCI数据集的实验中可以证明这种方法的可行性。
其他文献
舰船内部环境会对反恐兵力进行有效通信造成较大困难。基于无线自组网通信技术,结合反恐兵力行动特点,初步提出了两型通信设备及相关组织使用方案,方案的技术实现难度较低,可
1840年以后中国国门大开,近代西方体育运动也随着坚船利炮、工业产品涌入我国。我国的传统体育特别是武术,也开始革新并走向世界。1927~1937年黄金十年期间,我国体育产业水平
国有林场是林业最基层的经营单位,肩负着培育和保护森林资源的重要职责。以三门峡甘山国家森林公园为例,以对其进行防火规划设计为目标,探索了森林游憩地火险预警技术的构建
八极拳是我国的优秀拳种之一,在我国武术界别具一格,独树一帜,以其雄健刚猛的风格和独特多变的技击特点而享誉海内外,素有“文有太极安天下,武有八极定乾坤”之称,文章就如何
自动化立体仓库是实现物流系统合理化的关键。它具有空间利用率高、便于实现自动化管理、实时自动结算库存货物种类和数量,对加快物流速度、提高劳动生产率、降低生产成本都
我国电网正处在高速发展阶段,随着“全国联网,西电东送”战略的推进,不远的将来将形成全国性的交直流混合电网。按照国家电网公司规划,2010年山东电网将通过宁东直流接受来自
行政诉权是行政诉讼法学的一个基石性范畴,行政诉权本体论围绕着行政诉权的定义、本质、特征、构成要件等问题展开。在对行政诉权现有定义进行分析比较的基础上,将行政诉权的
电能量采集管理系统与传统电能量采集系统相比较,在通信方式、安装范围、信息采集量及整个系统的技术水平上都有很大改变,其系统在充分利用现有资源的基础上,又充分发挥了现
本研究调查高中生普遍存在的胃病现象及其影响因素,重点探索饮食习惯对胃病产生的影响,为改善高中生身体素质提供参考。使用自行编制的问卷,通过完全随机抽样的方式对金华市
目的:观察分别用异丙酚或10%水合氯醛全身麻醉下42℃全身高温30 min建立热应激模型大鼠下丘脑和血浆β-内啡肽的表达、海马区神经元凋亡情况和热痛阈的改变情况;研究异丙酚对