【摘 要】
:
现有聚类算法面向高维稀疏数据时多数未考虑类簇可重叠和离群点的存在,导致聚类效果不理想。为此,提出一种可重叠子空间K-Means聚类算法。设计类簇子空间计算策略,在聚类过程
【机 构】
:
西北师范大学计算机科学与工程学院,桂林电子科技大学广西可信软件重点实验室
【基金项目】
:
国家自然科学基金资助项目(61762078,61363058);广西可信软件重点实验室研究课题资助项目(kx201910)
论文部分内容阅读
现有聚类算法面向高维稀疏数据时多数未考虑类簇可重叠和离群点的存在,导致聚类效果不理想。为此,提出一种可重叠子空间K-Means聚类算法。设计类簇子空间计算策略,在聚类过程中动态更新每个类簇的属性子空间,并定义合理的约束函数指导聚类过程,从而实现类簇的可重叠性与离群点的控制。在此基础上定义合理的目标函数对传统K-Means算法进行修正,利用熵权约束分别计算每个类簇中各维度的权重,使用权重值标识不同类簇中维度的相对重要性,并加入控制重叠程度和离群值数量的参数。在人工数据集和真实数据集上的实验结果表明,该算法在
其他文献
中国当前面对的是经济全球化的全新发展环境。在今后相当长的一段时期内,实施以加快知识资本投入为主要手段的全球价值链提升战略应成为中国对外开放总体战略的重要基调。$$近
目的评价综合护理干预育龄妇女慢性盆腔炎的临床疗效。方法检索PubMed、Embase、Cochrane图书馆、CNKI中国知网数据库、中国生物医学文献数据库2010-2018年国内外公开发表的
“妈妈,您知道吗?猪肉和白菜、大葱搭配最营养,鸡肉和蘑菇搭配最营养,蘑菇居然烤着吃更鲜美……”9岁的尹忆彤滔滔不绝地向家里人分享着这次食育夏令营的收获。来自杭州的陈泓旭
多年来,《共同关注》《东方时空》都是央视新闻频道的王牌节目,吸引了很多观众。随着新媒体的日益崛起,很多电视新闻节目面临了极大的挑战。本文从播出时间、新闻编排、画面
选取9项主要财务指标,对汽车及配件行业19家上市公司进行了聚类分析和因子分析. 研究结果表明,两种分类方法都能把上市公司区分为蓝筹股、绩优股、一般股和劣质股,与公司的实
本文首先分别界定了陌生人社会和熟人社会的定义;其次介绍了两种不同社会形式的的差序格局;再次介绍了两种社会中人际信任的建立;最后谈及了自己在做这篇文章时的一点感悟。
本文论述了爆破片在其使用中的一些特殊性能,诸如损伤爆破压力.反向爆破压力.温度下爆破压力及夹持条件对爆破压力的影响。充分认识和掌握这些特殊性能,对爆破片乃至被保护的
课堂用语是小学英语教学的重要组成部分,教师在课堂中的一言一行会对小学生的思想形成与发展产生重要的影响。因此,在小学英语课堂教学中,教师要注意课堂用语的规范性和正确
促进人的全面发展是现代教育的旨归,而"单向度的人"是对人的一种解构。马尔库塞对单向度人的揭露,引发了人们对现代教育发展和人的发展向度等诸多问题的深切反思。在构建和谐
培养学生的批判性思维能力是国际教育界已达成的共识~([1])。近30年来,美国、英国等西方国家都积极将批判性思维融入教学当中,究其原因是批判性思维在教学中具有独特的价值,