论文部分内容阅读
[摘要]主要介绍数据仓库的定义及关键技术,结合航空公司战略决策支持系统,描述数据仓库技术的具体实现。
[关键词]数据仓库 数据集成 OLAP 数据集市
中图分类号:G35 文献标识码:A 文章编号:1671-7597(2008)1110106-02
一、引言
在机遇与挑战并存,市场竞争日渐激烈和扩大化的今天,如何提高管理水平、减少运营成本、保持和争取客源、实现航空公司营运收益的最大化等问题已经不仅仅是各航空公司急需解决的企业竞争和发展问题,现在已变成企业市场生存的战略问题。战略管理具有根本性、长效性,对企业可持续发展具有决定性的意义。而任何战略的制定和战略规划的实施都需要准确、高效、全面的决策支持平台,这个平台建立的成功与否,很大程度上决定着企业战略管理的成败。
令人欣慰的是,日新月异的信息技术为这个平台的建立提供了强有力的支持。数据仓库技术则是其中较为有效的一种。本文着重论述了数据仓库技术在航空公司决策支持平台上的应用。
二、数据仓库技术
(一)数据仓库
数据仓库(Data Warehouse, DW)是一种管理技术,它能够将分布在企业网络中不同站点的商业数据集成到一起,为决策者提供各种类型的、有效的数据分析,起到决策支持的作用。美国著名信息工程学家W.H.Inmon在《建立数据仓库》一书中对数据仓库做了如下定义:“数据仓库(Data Warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。”
所谓主题,它是数据归类的标准,每个主题对应一个客观分析领域,如销售状况、人事状况、整个企业的利润状况等。它可以辅助决策集成多个部门不同系统的大量数据。所谓面向主题,是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。
所谓集成,是指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是经过系统加工、汇总和整理,以确保数据仓库内的信息是关于整个企业的一致的全局信息。
所谓稳定,是指一旦某个数据进入数据仓库,一般情况下将被长期保留,也就是数据仓库中一般有大量的插入和查询操作,但修改和删除操作很少。
所谓包含历史数据,是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
(二)数据仓库支持决策的作用
从以上数据仓库的概念来看,数据仓库似乎是一个静态的概念,有些人认为数据仓库是一个大型的数据存储机制。事实上,数据仓库是一个工程的概念,是一个动态的概念。数据仓库的根本任务是把数据加以整理归纳,并及时提供给相应的管理决策人员,供他们做出改善其业务经营的决策,使信息发挥作用,支持决策。主要表现在:
第一、数据仓库有效集成了企业的业务数据,提供了标准的报表和图表的功能,为企业提供了按照主题的多方位的决策支持。
第二、数据仓库可以对分布在不同系统的业务数据进行清洗和加工,使它们成为统一格式的易于使用的支持决策的数据。
第三、数据仓库支持多维分析,应用多维分析可以在一个查询中对不同阶段的数据进行纵向或横向比较,这在决策过程中非常有用。
第四、数据仓库技术可以帮助企业决策者对企业未来状况作出预测,在数据仓库的基础上进行数据挖掘,就可以针对整个企业的状况和未来发展作出比较完整、合理、准确的分析和预测。
第五、成功的数据仓库系统可以为企业带来高的投资回报,企业通过建立一系列数据集市进行快速决策,可以对市场机会做出快速反应,这将为企业带来巨大的商业利益。
三、系统实现
基于数据仓库技术的航空公司决策支持系统,要针对航空公司的业务特点、主要问题以及建设目标,建立集中式的统一数据中心;建立并维护整个企业的业务名称、定义、规则以及代码标准;基于该标准进行各内部与外部系统的数据整合,为整个企业提供一致、统一的业务数据;同时基于管理人员信息访问与分析的需求建立数据仓库以及各种决策支持应用。整个系统的建设基于先进的企业级元数据管理基础之上,以保障系统的可管理性与可扩展性。
根据系统建设的目标,需要完成:
1.将企业内异构计算环境下各业务系统中的数据进行抽取、整合与转换;
2.将整合后的数据集中存储在数据中心;
3.将整合后的数据中心数据与现有及未来的其它系统进行共享;
4.将数据中心数据进行面向决策的重组,建立数据仓库系统;
5.基于数据仓库数据进行灵活报表、联机分析处理、主管信息系统等决策支持应用的构造,为管理人员提供及时、准确、一致的决策支持信息;
6.进行企业级元数据管理,管理公司现有IT资源。
系统的总体架构如图所示:

整个架构涵盖五个层次:业务系统层、数据中心层、数据仓库层、决策支持层以及元数据管理层。

1.业务系统层:企业现有内部、外部各业务系统。随着企业信息化建设的不断推进,还会有新的业务系统以及可以获得的外部数据源。
2.数据中心层:数据中心层作为整个企业的数据集中存储平台,融合了企业内部、外部各个系统的业务数据。依照统一的业务名称、定义、规则以及代码标准将各个业务系统中的数据进行清洗、加工、转换,存储并维护“唯一、准确”的业务数据,消除当前各业务系统中极为严重的数据不一致、同名异义、异名同义的现象。
3.数据仓库层:数据仓库中存放专门用于决策支持的数据,主要分为两部分:数据仓库基础区和面向各种分析的数据仓库汇总层。
4.决策支持层:通过提供灵活报表、联机分析处理、主管信息系统、数据挖掘等多种信息加工与分析手段为管理人员提供各种决策支持应用。
5.元数据管理层:通过统一的元数据管理为公司提供整个企业IT资源的集中管理,元数据管理层负责管理企业的业务元数据、技术元数据以及操作型元数据。
航空公司的运营效益直接取决于航线的运营效益,企业每年都会投入大量的时间、资金与人力进行航线优化,以推出更具竞争力的航线计划。因此,及时、准确地掌握从整个航线网络到每一条航线、每一个航段、每一个航班的业务量(Traffic)、收益(Revenue)和成本(Cost)信息是企业管理人员进行战术与战略决策的基础。
航线效益分析的目标也正是通过将企业各业务系统的生产数据、收入数据以及航线成本数据进行统一的清洗、加工、转换,在保障数据准确的基础上为企业各层管理人员提供灵活的分析手段,从多个角度(时间、航线、机型、航班性质等)分析企业的航线运营状况,从整体运营状况(全年的航线网络效益)到具体每天的每一个航班。支撑航线效益分析的主要数据来源为三大类:生产数据、收入数据和航线成本数据,每一类数据都由多个业务系统数据进行清洗、加工、转换、整合而成。在获得充分得数据后,就可以对表1列出的航线效益分析的主要指标进行分析,为管理人员提供决策支持。
四、结束语
数据中心与数据仓库系统是企业第一个真正意义上的决策支持系统,它搭建了企业级的数据平台数据中心,并构建了航线效益分析系统。它帮助企业的各级决策者共享不同业务部门的信息,更加全面地了解公司业务,能够帮助各级决策人员发现许多过去缺乏认识或者未被认识的数据关系,从而做出更好的商业决策。数据中心与数据仓库系统帮助企业降低了信息系统的建设和维护成本,以及管理成本,帮助分析人员提高了工作效率。该系统的建成及应用使得企业第一次对自己的数据资源实现了有效的控制,同时它还是国内民航业第一个成功的决策支持系统,将继续为企业的科学决策提供有力的支持。
参考文献:
[1]王彦龙编著,《企业级数据仓库(EDW)原理、设计与实践》.电子工业出版社.2006.9.
[2]刘莉,《数据挖掘在企业信息服务中的应用》.现代情报.2006年06期.
[3]张绍武,《数据仓库技术在企业竞争中的应用》.情报理论与实践. 2000.03.
[关键词]数据仓库 数据集成 OLAP 数据集市
中图分类号:G35 文献标识码:A 文章编号:1671-7597(2008)1110106-02
一、引言
在机遇与挑战并存,市场竞争日渐激烈和扩大化的今天,如何提高管理水平、减少运营成本、保持和争取客源、实现航空公司营运收益的最大化等问题已经不仅仅是各航空公司急需解决的企业竞争和发展问题,现在已变成企业市场生存的战略问题。战略管理具有根本性、长效性,对企业可持续发展具有决定性的意义。而任何战略的制定和战略规划的实施都需要准确、高效、全面的决策支持平台,这个平台建立的成功与否,很大程度上决定着企业战略管理的成败。
令人欣慰的是,日新月异的信息技术为这个平台的建立提供了强有力的支持。数据仓库技术则是其中较为有效的一种。本文着重论述了数据仓库技术在航空公司决策支持平台上的应用。
二、数据仓库技术
(一)数据仓库
数据仓库(Data Warehouse, DW)是一种管理技术,它能够将分布在企业网络中不同站点的商业数据集成到一起,为决策者提供各种类型的、有效的数据分析,起到决策支持的作用。美国著名信息工程学家W.H.Inmon在《建立数据仓库》一书中对数据仓库做了如下定义:“数据仓库(Data Warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。”
所谓主题,它是数据归类的标准,每个主题对应一个客观分析领域,如销售状况、人事状况、整个企业的利润状况等。它可以辅助决策集成多个部门不同系统的大量数据。所谓面向主题,是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。
所谓集成,是指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是经过系统加工、汇总和整理,以确保数据仓库内的信息是关于整个企业的一致的全局信息。
所谓稳定,是指一旦某个数据进入数据仓库,一般情况下将被长期保留,也就是数据仓库中一般有大量的插入和查询操作,但修改和删除操作很少。
所谓包含历史数据,是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
(二)数据仓库支持决策的作用
从以上数据仓库的概念来看,数据仓库似乎是一个静态的概念,有些人认为数据仓库是一个大型的数据存储机制。事实上,数据仓库是一个工程的概念,是一个动态的概念。数据仓库的根本任务是把数据加以整理归纳,并及时提供给相应的管理决策人员,供他们做出改善其业务经营的决策,使信息发挥作用,支持决策。主要表现在:
第一、数据仓库有效集成了企业的业务数据,提供了标准的报表和图表的功能,为企业提供了按照主题的多方位的决策支持。
第二、数据仓库可以对分布在不同系统的业务数据进行清洗和加工,使它们成为统一格式的易于使用的支持决策的数据。
第三、数据仓库支持多维分析,应用多维分析可以在一个查询中对不同阶段的数据进行纵向或横向比较,这在决策过程中非常有用。
第四、数据仓库技术可以帮助企业决策者对企业未来状况作出预测,在数据仓库的基础上进行数据挖掘,就可以针对整个企业的状况和未来发展作出比较完整、合理、准确的分析和预测。
第五、成功的数据仓库系统可以为企业带来高的投资回报,企业通过建立一系列数据集市进行快速决策,可以对市场机会做出快速反应,这将为企业带来巨大的商业利益。
三、系统实现
基于数据仓库技术的航空公司决策支持系统,要针对航空公司的业务特点、主要问题以及建设目标,建立集中式的统一数据中心;建立并维护整个企业的业务名称、定义、规则以及代码标准;基于该标准进行各内部与外部系统的数据整合,为整个企业提供一致、统一的业务数据;同时基于管理人员信息访问与分析的需求建立数据仓库以及各种决策支持应用。整个系统的建设基于先进的企业级元数据管理基础之上,以保障系统的可管理性与可扩展性。
根据系统建设的目标,需要完成:
1.将企业内异构计算环境下各业务系统中的数据进行抽取、整合与转换;
2.将整合后的数据集中存储在数据中心;
3.将整合后的数据中心数据与现有及未来的其它系统进行共享;
4.将数据中心数据进行面向决策的重组,建立数据仓库系统;
5.基于数据仓库数据进行灵活报表、联机分析处理、主管信息系统等决策支持应用的构造,为管理人员提供及时、准确、一致的决策支持信息;
6.进行企业级元数据管理,管理公司现有IT资源。
系统的总体架构如图所示:

整个架构涵盖五个层次:业务系统层、数据中心层、数据仓库层、决策支持层以及元数据管理层。

1.业务系统层:企业现有内部、外部各业务系统。随着企业信息化建设的不断推进,还会有新的业务系统以及可以获得的外部数据源。
2.数据中心层:数据中心层作为整个企业的数据集中存储平台,融合了企业内部、外部各个系统的业务数据。依照统一的业务名称、定义、规则以及代码标准将各个业务系统中的数据进行清洗、加工、转换,存储并维护“唯一、准确”的业务数据,消除当前各业务系统中极为严重的数据不一致、同名异义、异名同义的现象。
3.数据仓库层:数据仓库中存放专门用于决策支持的数据,主要分为两部分:数据仓库基础区和面向各种分析的数据仓库汇总层。
4.决策支持层:通过提供灵活报表、联机分析处理、主管信息系统、数据挖掘等多种信息加工与分析手段为管理人员提供各种决策支持应用。
5.元数据管理层:通过统一的元数据管理为公司提供整个企业IT资源的集中管理,元数据管理层负责管理企业的业务元数据、技术元数据以及操作型元数据。
航空公司的运营效益直接取决于航线的运营效益,企业每年都会投入大量的时间、资金与人力进行航线优化,以推出更具竞争力的航线计划。因此,及时、准确地掌握从整个航线网络到每一条航线、每一个航段、每一个航班的业务量(Traffic)、收益(Revenue)和成本(Cost)信息是企业管理人员进行战术与战略决策的基础。
航线效益分析的目标也正是通过将企业各业务系统的生产数据、收入数据以及航线成本数据进行统一的清洗、加工、转换,在保障数据准确的基础上为企业各层管理人员提供灵活的分析手段,从多个角度(时间、航线、机型、航班性质等)分析企业的航线运营状况,从整体运营状况(全年的航线网络效益)到具体每天的每一个航班。支撑航线效益分析的主要数据来源为三大类:生产数据、收入数据和航线成本数据,每一类数据都由多个业务系统数据进行清洗、加工、转换、整合而成。在获得充分得数据后,就可以对表1列出的航线效益分析的主要指标进行分析,为管理人员提供决策支持。
四、结束语
数据中心与数据仓库系统是企业第一个真正意义上的决策支持系统,它搭建了企业级的数据平台数据中心,并构建了航线效益分析系统。它帮助企业的各级决策者共享不同业务部门的信息,更加全面地了解公司业务,能够帮助各级决策人员发现许多过去缺乏认识或者未被认识的数据关系,从而做出更好的商业决策。数据中心与数据仓库系统帮助企业降低了信息系统的建设和维护成本,以及管理成本,帮助分析人员提高了工作效率。该系统的建成及应用使得企业第一次对自己的数据资源实现了有效的控制,同时它还是国内民航业第一个成功的决策支持系统,将继续为企业的科学决策提供有力的支持。
参考文献:
[1]王彦龙编著,《企业级数据仓库(EDW)原理、设计与实践》.电子工业出版社.2006.9.
[2]刘莉,《数据挖掘在企业信息服务中的应用》.现代情报.2006年06期.
[3]张绍武,《数据仓库技术在企业竞争中的应用》.情报理论与实践. 2000.03.