【摘 要】
:
如今聚类分析已成为数据挖掘领域的重要分析手段,根据机器学习的划分聚类分析属于无监督学习.在基于现实问题的不断发展过程中,模糊理论可以有效地描述样本之间不确定性,而半监督学习方法能够利用先验知识,这两种理论引起了聚类分析领域学者的广泛关注.在前人已有的理论基础上,通过拓展极大熵聚类算法提出基于模糊理论的半监督聚类分析算法,该数学模型的中心思想是将聚类分析问题变为一个带约束条件的数学问题,利用最优化求
论文部分内容阅读
如今聚类分析已成为数据挖掘领域的重要分析手段,根据机器学习的划分聚类分析属于无监督学习.在基于现实问题的不断发展过程中,模糊理论可以有效地描述样本之间不确定性,而半监督学习方法能够利用先验知识,这两种理论引起了聚类分析领域学者的广泛关注.在前人已有的理论基础上,通过拓展极大熵聚类算法提出基于模糊理论的半监督聚类分析算法,该数学模型的中心思想是将聚类分析问题变为一个带约束条件的数学问题,利用最优化求解过程来确定样本数据集的模糊划分和聚类情况.此类研究已经取得了重要的研究成果,但针对不同数据集的具体情况,如何有效利用基于成对约束的目标函数处理聚类样本依然值得探索.本文在基于功效散度和成对约束的半监督聚类算法(PD-s SC)基础上,针对PDs SC算法在成对约束数目较大时,聚类效果不够理想情况展开研究.为了解决上述问题,本文依据相关研究理论做了如下工作:1.针对成对约束数目较大问题进行分析,引入闭包准则将成对约束中的must-link约束类进行打包处理,降低原始数据成对约束容量,利用各个包的中心点替代整个闭包结构重新构造新的cannot-link约束,确保在聚类过程中算法不会产生违反must-link约束问题,需要说明的是,新样本带更新后的cannot-link约束但没有must-link约束,最后在PD-s SC算法基础上构造新的目标函数得到CCPC算法,再对新样本进行聚类分析.2.在编程实现CCPC算法的过程中,对隶属度向量进行归一化操作时,为了解决算术溢出问题,加入了截尾指数函数对算法流程进行控制项干预,降低了编程难度.经过实验测试,截尾指数函数替换对CCPC算法的聚类效果影响忽略不计.3.实验研究通过选取UCI标准数据集和采集现实特征数据集,利用闭包准则和三种聚类评价指标的方法,设计对应的算法实验过程,并选择PD-s SC算法、CE-s SC算法、PCBKM算法和SSC算法进行实验比较.实验结果表明,无论成对约束数目是大是小,CCPC算法都有很好的表现.
其他文献
玻璃、陶瓷是当今社会新兴、热门的脆硬材料,深受材料领域学者广泛的青睐,使其应用范围越来越广。但是其脆性大、硬度高的特点使得对硬脆材料的精密加工变得困难,容易出现加
加强和提升大学生思政课教学获得感已经成为高校思想政治教育工作的重要目标。如何根据大学生思政课教学获得感结构特征,从而有针对性地提出大学生思政课教学获得感的提升路径,增强高校思想政治理论课的实效性呢?采用文献研究和问卷调查相结合的研究方法展开研究。首先,明确大学生思政课教学获得感的内涵及内容;其次,通过文献综述与理论思维,厘清大学生思政课教学获得感的理智脉络,确定大学生思政课教学获得感的维度,依据思
目的:本研究通过比较血瘀证与非血瘀证2型糖尿病肾病患者血清游离脂肪酸水平,及其与血瘀证证候积分的相关性,为活血法治疗2型糖尿病肾病提供理论依据。方法:在2018年12月至2019年12月深圳市中医院内分泌科住院病人中收集血瘀证与非血瘀证且符合2型糖尿病肾病诊断的患者各40例,观察2组患者基本情况、血瘀证证候积分、糖脂代谢指标、肾功能指标、颈动脉内中膜厚度及游离脂肪酸的差异,分析游离脂肪酸与血瘀证证
随着我国人口老龄化进程加速,老年人养老保障不足的问题愈演越烈。目前,我国的老年人主要采用三种方式度过晚年:一是与子女同住,由子女照顾老人的日常起居;二是自己在养老院中常住,子女偶尔前来探望;三是入住养老社区,相关养老服务由社区专业人员提供,保证生活质量不变。而建立多元化的养老社区是我国现阶段养老产业布局的主要发展方向。养老地产是养老社区的载体,发展养老产业的第一条件就是开发高质量的养老地产。本文以
大豆是重要的经济作物,是人们日常所需的高质蛋白和商业化原料来源,在农业中具有举足轻重的地位。但目前,我国大豆的总产量远远不能满足人们对大豆及其制品的日常需求,每年需
随着科学技术的快速发展,工业设备的智能化程度越来越高,相应的维修难度也越来越大,设备一旦发生故障停止工作,将会给用户带来巨大的经济损失,传统的到现场维修的方式已经无
多线激光雷达技术是一种新型表面探测技术,它利用激光测距原理,同时获得空间上的多个点的位置、距离等信息,从而进行目标的三维模型重建和探测物本身所处环境和位置的定位。
未来想象是人独有的认知能力,它来源于以往的经验,可以影响当下的行为。抑郁者的未来想象有两个主要表现:(1)积极未来想象更少且生动性更差;(2)消极未来想象增多且发生可能性更大,已有研究对抑郁者的未来想象特点存在争议。事件重要性会影响抑郁者的未来想象,和普通人相比,抑郁者重要积极未来想象及其积极评价减少,不重要积极未来想象正常;重要消极未来想象及其消极评价增加,不重要消极未来想象正常。依据Reopk
交通问题是世界各国面临的共同难题,交通流量检测是智能交通系统中极为重要的一部分。传统交通流量检测手段均存在一定缺点,当前基于视频图像序列的交通流量检测是交通监测的
丝锥主要用来加工各类尺寸的内螺纹,在金属切削加工中占有非常重要的地位。然而丝锥攻丝内螺纹为半封闭切削,散热条件差、切削温度高、刀齿易磨损,严重影响螺纹质量、加工效