【摘 要】
:
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一种重要算法,它把大量数据点的集合分成若于类,使得每个类中的数据最大程度地相似,而不同类中的数据最大程度地不同。尤
【机 构】
:
中国科学院光学天文重点实验室国家天文台,河北师范大学物理学院
【基金项目】
:
国家自然科学基金(10778724), 863资助项目(2006AA01A120), 中国科学院国家天文台青年人才基金项目资助
论文部分内容阅读
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一种重要算法,它把大量数据点的集合分成若于类,使得每个类中的数据最大程度地相似,而不同类中的数据最大程度地不同。尤其对于大样本,在多参量和类别未知的情况下,该方法更为简洁有效。为了更好地使用这些算法,对数据挖掘领域的聚类分析方法及代表算法进行了讨论,阐述了数据挖掘对聚类算法的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了概括,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。综述了数据挖掘中聚类算法的分类和原理以及常用的聚类算法在天文学中的
其他文献
使用了目前最大的棒旋星系样本之一,着重于研究旋涡星系中央的比恒星形成率(sSFR)和棒结构的关系。我们用lg sSFR =-11 a^-1作为星系宁静态和活跃态的分界,统计对比了棒旋星系和
波江座α是一颗具有代表性并被比较充分观测的快速自转恒星。以该星为例,建立了一种可以利用有限的观测数据有效反演此类恒星椭球形状及其内部结构的并行数值方法。求解此刚譬
目的探讨动力髋螺钉(DHS)加三叶钢板治疗不稳定粗隆间骨折的临床疗效。方法采用DHS加三叶钢板治疗不稳定粗隆间骨折患者32例。术前先对患肢进行皮肤牵引或骨牵引3-5d,然后在C型
带状疱疹的发生部位与病因有密切联系,上部与风温、风热相关,中部与气郁、火郁相关,下部与湿热、寒湿相关。从上、中、下3个部位探讨带状疱疹的发病规律,并附3则典型病案,对
流体动力学(Hydrodynamics,HD)与磁流体动力学(Magnetohydrodynamics,MHD)高效数值计算方法被广泛应用于天体物理领域,用来研究和解释天体系统中有关磁场和流场的演化以及能量
理论上,低质量高吸积率活动星系核的标准吸积盘黑体热辐射有可能形成软X射线波段的超出。然而,活动星系核的软x射线超温度为0.1keV左右,显著高于标准吸积盘理论预言的最高有效温
利用从2008年8月5日到2013年10月23日Fermi-LAT的观测数据,对4C 21.35的100 MeV到300 GeV的γ射线数据进行了分析,总结了1天bin情况下的光变特征,并在3小时bin的基础上详细研究
日本SELENE的两个小卫星Rstar和Vstar都搭载两个晶振作为VLBI多频点信标源的基准,其中一个晶振产生信号f1,另一个晶振产生信号f2如和f3。通过分析Rstar和Vstar的同波束VLBI观测