数据仓库多维计算的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:m116730647
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何有效的管理和利用企业在运营过程中产生的大量数据和信息一直是信息系统工作人员面临的重要问题。数据仓库与联机分析处理为这一问题提供了解决方法。 数据仓库(data warehouse)采取一种集中式的结构,它将整个公司的数据统一储存在一个数据库中。通常,它的数据是以数据立方体(data cube)的方式组织在一起的,能够对数据做许多不同的查看和各种组合。为了提高查询分析的速度,在联机分析处理之前都会对数据立方体进行预计算,即立方体实物化的过程。其中数据预计算在很大程度上都是进行聚集计算。聚集计算是一种在决策支持系统中占主导地位的操作,是一种常用的技术。它的重要思想是把那些代价昂贵的常用运算如:Count、Sum、Average、Max、Min等聚集函数预先计算出结果,并存储数据库中。这样在联机分析的时候就可以在已经做过预处理的数据上进行快速的分析。 本文研究了数据立方体上的多维计算,给出了多维切片(或单元格)间的算数运算形式定义和基于SQL的算法。设计了多维算数运算描述语言并通过计算机程序实现了该算法。讨论了上述多维计算与聚集计算的关系,对于不能含盖的整体聚集,给出了在OLAP报表中的实现方法。 本文在后面章节介绍了此算法在北京朝批商贸有限公司数据仓库系统中的实际应用以及取得的满意效果。
其他文献
学位
随着计算机技术的发展和数据库的广泛应用,企业信息系统中的“信息孤岛”问题越来越严重。异构数据源集成技术就是为了解决异构数据源间方便、灵活的互访问题。在研究异构数
近年来,随着网络技术和计算机仿真技术的快速发展,分布式仿真、基于网络的仿真支撑平台成为人们研究的热点之一。本课题主要对仿真支撑平台开发过程中的关键技术进行研究和探讨
下一代网络是业务驱动的网络,业务和市场将决定新技术的取舍。下一代网络业务平台是一个开放式的业务体系,业务可以部署在运营商外的应用服务器上。基于JAIN(Java Architecture
近年来,Internet的高速发展,给人们的生活带来了极大的便利,人们开始重新思考互联网的服务质量、可靠性和效率。然而用户感受到的系统响应速度却没有相应的提高,甚至还越来越慢。
随着人们生活水平的不断提高,人们对信息消费多元化的趋势越加明显。传统的固定地面电视已难以满足人们的消费需求,人们希望可以随时随地的收看高清晰画面的电视节目,这促使
学位
随着互联网技术的快速发展,高分辨率数码相机以及功能强大的图像编辑软件的出现,图像篡改已经越来越普遍,它在一定程度上丰富了人们的日常生活,杂志封面和商业广告上精美的图
软件可靠性是计算机工程中的一个重要领域。软件可靠性评估是软件可靠性研究的重要内容,通过软件可靠性评估,量化软件可靠性有关参数,为软件的使用建立信心。软件可靠性模型
随着网络通信的普及,许多传统媒体内容都向数字化转变,并且在电子商务中即将占据巨大市场份额,如mp3的网上销售,数字影院的大力推行,网上图片、电子书籍销售等等,在无线领域,随着移