论文部分内容阅读
数据挖掘是2 0世纪末兴起的数据智能分析技术,它可以从数据库、数据仓库以及其它各种数据库中的大量数据类型数据中,自动抽取或发现出有用的模式知识。在这一过程中,对聚类分析是数据挖掘领域研究的重要课题。而在图书管理这样庞大的数据管理系统中,每天、每月、每年都会产生大量的统计数据和表单。而聚类分析就是将数据合理归类的一种方法,其目的是把相似的东西归为一类,使得类内具有较大的相似性,而类间具有较小的相似性。因此本文将k-means聚类算法应用于图书管理系统中,面对这些海量数据,研究如何将它们合理归类。首先,本文简要介绍了数据挖掘的基本理论,接着描述了聚类的含义以及针对不同数据类型的差异度计算,然后列出了数据挖掘中现存的几种有代表性的聚类算法的思想以及它们的优缺点,最后重点描述了K-means算法,以及该算法的基本思想和原理。然后,详细介绍了图书管理系统的分析设计与实现,图书管理系统中主要功能包括:图书的添加、查询、浏览、删除和修改管理以及相关的图书用户的管理,这样可以方便图书管理员对庞大信息进行管理,本文采用JAVA语言作为开发工具,使用ACCESS 2003数据库作为存储数据库,来实现图书管理系统的功能。最后将典型的k-means聚类算法应用于图书管理系统,对图书进行聚类分析,应用效果良好。此系统以图书管理系统中的历史借阅记录、读者信息库为基础数据来源,用k-means聚类算法对读者的院系特性、性别特性和年级特性分别进行聚类分析,然后按图书使用率将图书使用情况分为高、中、低3类,最终得出聚类结果。聚类结果表明,图书馆采购部门应根据现有的图书适当购进一些社会、言情小说,惊险、推理小说,英语读物,英语基本词汇、英语会话图书、英语考试图书,英国短篇小说,散文类图书,计算机程序语言和网络类等图书来满足不同学生读者的需求。聚类结果在一定程度上能够指导图书馆采购部门及时补充图书,以满足读者对图书的需求。