基于SOM聚类的数据可视化系统研究与实现

被引量 : 5次 | 上传用户:jianbin0703
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算和大数据是目前研究的热点问题之一。现代信息社会每时每刻都会产生大量的非结构化数据,对这些数据的处理和分析目前还面临着许多挑战。首先,数据量庞大,数据类型多样,非结构化和半结构化数据占很大一部分,对这些数据的处理是有挑战性的工作。其次,这些数据有很强的时效性,数据时时刻刻产生,要求数据处理的速度非常快,否则这些数据的处理将会毫无意义。可视化技术通过把大量的数据用图形的方式直观展示,可以帮助人们有效地对数据进行分析和观察,发现和挖掘隐藏在大量数据中的“秘密”,为辅助决策提供了可靠的技术支持。同时给社会和企业带来巨大的社会效益和经济效益。本文介绍了可视化技术的特点和发展前景,可视化概念及分类,对文本内容可视化技术手段做了重点阐述,分析了传统的自组织映射神经网络SOM(Self-OrganizingMapping)算法的优缺点,对SOM聚类算法随机初始化权值造成聚类时间过长问题做了改进,通过对初始权值进行分析计算,找出合适的初始权值,可以节省大量的时间。还针对SOM聚类决胜策略做了优化,解决了有些神经元不能获胜,而有些神经元获胜过多的问题。通过对改进后的算法比对分析,在对大规模数据处理时,改进后的算法效果比之前的更加准确。最后设计和实现了基于SOM聚类算法的可视化系统原型,以微信公众账号为例,根据微信公众账号信息的获取特点,把获取的信息进行了改进SOM算法聚类计算,聚类的结果通过jFreeChart展现出来,可以准确的反应聚类结果。
其他文献
采用大田小区试验方法,以白菜为供试作物,以活化腐植酸和工业碱性废渣为原料制备的腐植酸有机无机复合物(HC)为土壤调理剂进行试验,研究其对白菜种子发芽、植株生长速度及产
针对传统的基于迭代学习控制算法的同步发电机励磁控制器存在初始控制信号由经验确定的问题,提出了一种基于即时学习型迭代学习控制算法的同步发电机励磁控制器的设计方案。
公立医院改革是新医改的重点和难点。无论是改善医疗保障公平性还是提高医疗服务绩效,真正让老百姓感受到看病方便、便宜、放心,都要依靠公立医院改革。但是,目前对公立医院
目的探讨中药保留灌肠与心理护理联合干预老年慢性肾衰的效果。方法针对2018年4月至2019年4月期间我院收治的老年慢性肾衰患者共计112例,根据双盲分组法将患者分成观察组(n=5
<正>声乐教育是幼教专业的基础学科,在提高幼儿教师专业化水平的过程中发挥着不可替代的作用。但是,由于诸多因素的影响,目前幼教专业的声乐教学还存在很多现实的问题,距离"
网络新环境给当代大学生的学习提供了便利的学习环境和更大的知识空间,同时对高校教师的教学提出了很大挑战。为了使高校教师更好地发挥引导者的作用,本文分析了网络给大学生
近年来,随着网络的飞速发展和网络技术的普及,Web应用已被广泛使用在Internet以及Intranet上,越来越多的应用通过Web的方式提供给用户使用。目前Web应用的部署都是采用经典的
协同过滤算法一般根据用户的评价信息来推测用户的喜好,但受到数据稀疏问题的影响,许多时候无法得到较为理想的推荐结果。除此之外,一般协同推荐算法忽略了用户兴趣的动态变
<正> 新(乡)菏(泽)线跨越京广铁路的立交特大桥,位于河南省新乡市南郊。该桥长约3km,其中一部分梁跨为8m的桥墩软弱地基经强夯处理后,采用明挖基础。在桥墩施工前,铁道部第一
目的:观察玻璃酸钠注射配合活膝汤治疗膝骨性关节炎的疗效。方法:选取膝关节骨性关节炎患者68例,将其分成对照组和治疗组各34例。对照组予玻璃酸钠注射治疗配合口服塞来昔布