论文部分内容阅读
如何有效的管理和利用企业在运营过程中产生的大量数据和信息一直是信息系统工作人员面临的重要问题。数据仓库与联机分析处理为这一问题提供了解决方法。
数据仓库(data warehouse)采取一种集中式的结构,它将整个公司的数据统一储存在一个数据库中。通常,它的数据是以数据立方体(data cube)的方式组织在一起的,能够对数据做许多不同的查看和各种组合。为了提高查询分析的速度,在联机分析处理之前都会对数据立方体进行预计算,即立方体实物化的过程。其中数据预计算在很大程度上都是进行聚集计算。聚集计算是一种在决策支持系统中占主导地位的操作,是一种常用的技术。它的重要思想是把那些代价昂贵的常用运算如:Count、Sum、Average、Max、Min等聚集函数预先计算出结果,并存储数据库中。这样在联机分析的时候就可以在已经做过预处理的数据上进行快速的分析。
本文研究了数据立方体上的多维计算,给出了多维切片(或单元格)间的算数运算形式定义和基于SQL的算法。设计了多维算数运算描述语言并通过计算机程序实现了该算法。讨论了上述多维计算与聚集计算的关系,对于不能含盖的整体聚集,给出了在OLAP报表中的实现方法。
本文在后面章节介绍了此算法在北京朝批商贸有限公司数据仓库系统中的实际应用以及取得的满意效果。