论文部分内容阅读
数据挖掘是从海量数据中提取隐含在其中的、事先未知的、但又是潜在有用的信息和知识的非平凡过程,是一门新兴的边缘学科。它汇集了来自机器学习、模式识别、数据库、统计学、人工智能以及管理信息系统等多学科的成果。
本文的主要工作是基于LHSMDSS(LianHuaSupermarketDecisionSupportSystem,联华超市决策支持系统)系统中的数据挖掘模块的设计和实现所展开的。LHSMDSS系统中的数据挖掘模块是建立在数据仓库技术和OLAP技术的基础上,运用关联分析、分类、聚类分析和预测分析等数据挖掘方法,从海量的交易数据中发掘有价值的知识,为超市的决策者提供科学的决策信息和依据。
本文的工作主要包括:LHSMDSS系统数据挖掘模块的设计和实现,包括运用基于FP-growth算法实现商品关联交易规则的发现、动态聚类的方法实现商品聚类、C4.5算法构造决策树实现客户分类和预测、多元线性回归和最小二乘法实现销售趋势的预测;最后,借助数据挖掘模块对超市中的历史数据进行了分析,得出了许多重要的知识,这些重要知识为超市的客户关系管理、市场营销和战略决策提供了重要的信息,并带来了较大的经济效益。