论文部分内容阅读
随着传统邮政步入信息时代,网络应用日益广泛,邮政在为用户提供服务的同时也积累了大量的名址数据,名址信息的有效利用已经越来越成为发展邮政商函业务及各种综合网上邮政业务的迫切需求。
中国邮政集团公司适时的提出了建设全国邮政名址信息系统的要求,系统的特点就是着重于对大量历史数据(包括当前数据在内)进行复杂的综合分析与处理,提供给业务人员和管理人员各种复杂的统计数据。为了满足并行处理、自动优化、线性扩展和数据挖掘的深层次需要,邮政名址信息系统决定采用Teradata数据仓库。
Teradata,是专门用来处理大量数据、针对决策支持应用而设计出来的数据仓库引擎,具有很强的并行处理能力和扩展能力。本文在深入研究全国邮政名址信息系统业务需求的基础上,结合邮政业务的特点与发展前景,对技术实现与系统功能进行了描述。主要对以下几项内容进行了研究并设计:
1.全国邮政名址信息系统总体设计和软件架构设计。按照全国中心、省中心、地市中心及支县局客户端的四级机构模式对数据采集整理、数据查询、数据交换、数据维护、统计报表和打印制作等功能进行了设计。
2.对全国邮政名址信息系统数据存放模式的研究。确定对于基础地址数据和可以全国共享的名址数据在全国中心直接加载到名址库主库,各省、地市的名址数据只能先上传到全国中心,全国中心加载后再下发到各地。
3.数据处理流程的设计。将源数据经过一系列的转换处理,加载到全国邮政名址信息系统之中,即数据抽取、数据转换、数据传输、数据加载(ETL)的过程。
全国邮政名址信息系统采用了数据仓库技术,建成了全国性、权威性、统-管理、便于维护、数据及时更新、安全可靠运行的信息系统。目前系统中有2亿多条基础地址,全国每年名址数据的使用下载量达到3.7亿条。后续将在此基础上逐步扩展为中国邮政企业数据仓库,建立邮政客户管理和经营分析系统。