【摘 要】
:
该论文主要探讨了若干关于数据仓库设计和数据挖掘实现的问题.首先,在总结前人提出了的数据仓库平台的基础上,针对其不足提出了自己的改进方法.数据仓库平台是决定数据仓库环
论文部分内容阅读
该论文主要探讨了若干关于数据仓库设计和数据挖掘实现的问题.首先,在总结前人提出了的数据仓库平台的基础上,针对其不足提出了自己的改进方法.数据仓库平台是决定数据仓库环境的性能的是一个要因素,而平台的体系结构则决定了平台的性能.数据仓库平台的体系结构有多种,在实际建立数据仓库时没有一个统一的标准.数据仓库平台的体系结构常用的有两层结构、三层结构和联合结构,其中较优的是联合结构.该文指出联合结构的成败在于全局逻辑模型,而它却难于设计,针对此作者提出了自己的改进方法,能够用来设计出更健壮的全局逻辑模型,其核心思想是:用E-R建模技术和上溯式迭代的方法来辅助设计全局逻辑模型.其次,归纳、总结了实施数据仓库工程项目的一般方案,明确指出每步的目的、工作内容、应得到的结果和衡量完成的标准.各个公司实施数据仓库的步骤主要是根据自己的数据仓库产品套件来安排,并没有一个唯一的遵循标准.作者总结一般的实施方案目的是想在遵循一个标准的基础上来确定每步应该选择的开发工具,使得开发过程更灵活,而不是局限于一两个厂商的解决方案.最后,用BP神经网络实现了对该文本数据源的挖掘,以葡萄酒的分类问题做为实例.在该程序中,实现了标准算法、加入动量项的算法和Quickprop算法,通过实例的验证比较了各个算法的收敛速度.
其他文献
该文给出了广东省移动客户服务中心的设计,包括系统的总体设计、实现方法,并研究用多线程设计系统的外部接口模块.该文第一章给出了项目的背景和意义;第二章客户服务中心概述
近些年来社交网络得到了快速的发展,其独有的特性使得用户发布消息更加容易,信息传播更加快捷,然而社交网络的发展也对于商业机构的管理者和政府机构的决策者,提出了一定的挑
本文讨论了软件复用(Software Rouse)中的几个常见问题:软件构架(Software Framework)的使用、脚本语言(Script Language)以及面向对象(00--Object Oriented)方法与软件复用的关系。利
该论文针对GIS的发展趋势,在对当前InternetGIS技术深入分析的基础上,提出了基于平衡网络负载的InternetGIS实现方案.论文分为五个部分:第一章简要概述了地理信息系统的历史
软件能力成熟度模型(CMM)是一种对软件企业开发能力的评估模型,可以通过指导开发组织如何进行过程改进,从而帮助软件企业达到更高级别,并向成熟的软件工程体系演化,并形成一
近年来,信息技术有了迅速的发展,如何及时准确地传递数字图象是其中一个重要的课题。在利用人造卫星和飞机遥感获取、传输等过程中,会造成图象的退化,使之与真实图象有一定差异。
随着IPv4地址的日益减少,使用IPv6地址替代IPv4地址已成为解决地址匮乏问题的关键,这就使IPv4向IPv6过渡成为越来越重要的课题。由中国电信提出的Lightweight address family
网络技术发展速度迅猛,越来越多的Web Services和语义Web Services遍布于网络上,人们对于服务的选择范围越来越广,对于服务的利用也越来越方便。网络上有众多服务可供选择,而
该文首先分析并研究了现有的构件模型以及构件集成方式.通过对三种不同接口形式体系结构的分析,基于有关构件模型和构件描述语言,设计实现了基于是一模型的组装工具.该文第1
本文分析了四川省卫生厅建立四川省医疗卫生信息数据仓库及联机统计分析的必要性和迫切性,阐述了数据仓库技术的来源、提出了四川省医疗卫生信息数据仓库及联机统计分析系统的