云计算环境下物流路径数据挖掘研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:chester116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业物流信息化水平不断提高,互联网的普遍运用,产生了海量的物流数据,大量的数据中隐藏着重要的信息。为了提高企业的核心竞争力,给客户提供更优质的物流服务,物流企业需要不断提高决策效率,因此如何从大量的物流数据中获取有价值的信息,辅助企业日常经营活动中的决策,成为企业面临的一个重要问题。通过对物流的路径数据进行数据挖掘分析,发现频繁移动的路径模式,从而获取关于货物流向的知识,预测货物的移动信息,找出异常的移动货物。通过频繁的路径模式,还可以深入了解物品在移动过程中的详细情况,以及这些频繁的路径隐含着的一些移动趋势信息。通过发现的频繁路径模式,可以为企业物流业务经营提供有力的决策支持,从而优化物流环节,从而降低整个物流成本。本文在系统的介绍了数据挖掘、云计算和物流路径相关理论基础上,阐述了物流路径频繁模式挖掘理论知识,并针对物流路径数据特点,采用云计算的MapReduce模型对数据挖掘的序列模式基本算法进行并行化改进,最后用改进的算法对物流路径进行挖掘分析,发现频繁路径模式。在相关研究理论的基础上,本文首先对物流路径频繁模式挖掘进行了相关研究。先阐述了物流路径频繁模式应用,接着,由于物流路径是一种序列数据,参考序列模式的相关定义,定义了物流路径频繁模式挖掘的相关概念,并采用序列模式挖掘算法中的基于Apriori思想的算法发现物流路径频繁模式。接着针对物流路径数据的特点,采用了MapReduce并行计算模型,对序列模式挖掘的基本算法AprioriAll进行改进。由于基于Apriori思想的序列模式挖掘算法对物流路径数据进行分析时,需要多次扫描数据库,并且会产生大量无用的候选序列,当数据量很大时,会占用大量的计算资源。MapReduce是云计算环境的并行计算模型,本文将序列模式挖掘的算进进行并行化改进,使之能适用于MapReduce计算模型。最后将改进的算法用于物流路径频繁模式发现,研究结果表明本文的研究思想是可行的。
其他文献
现阶段,经济全球化速度不断加快,科学技术的更新日新月异,企业竞争渐趋白热化,但山东企业大都采取OEM的制造方式,自主创新能力薄弱,产品附加值低,大都处在生产链条上的初级阶段,这在很大程度上限制了山东企业竞争力的发展。本文结合国内外的相关研究,在统计、经济、管理、系统科学等多学科理论和方法的基础上,从企业流态的全新视角,以企业流态评价指标体系为切入点,从以下四个方面就企业流态转型及自主创新能力提升展
城市化是中国经济发展与社会转型的必经阶段,也为中国的经济增长做出了巨大贡献,但在城市化过程中也产生了许多负面影响。一方面是城市空间向外围无序蔓延。为求得城市规模的扩
读了贵刊第5期刊登的建国饭店黄金岐同志八年如一日干好本职工作,做好“不起眼、没报酬、人后事”的事迹,深受启发。黄金岐作为90年代的青年,而且工作在四星级饭店,应当说条
元数据是一种最具前景的资源描述方式。本文系统讨论了 DC研究的系列成果及最新进展 ,并对因特网信息资源的规范化进行了具体探讨 Metadata is one of the most promising w
公共项目投资是社会发展的基础,但该领域长期存在资金短缺问题。公私合作模式引导社会资本进入公共项目领域投资,不仅可以加快公共项目的供给速度,提高供给质量;也可以不断发挥公
随着Web2.0的发展和深入,Wiki系统已在知识协同与共享中获得了广泛的应用。Wiki系统的开放性、协同性、有组织性等特性使得其形成了面向社群的、多人参与的知识协同环境。正是
会议新闻,是大多数媒体的必有新闻。如何报好会议新闻,又是各媒体深感棘手的难题。在新闻改革中,如何把会议新闻铸就成精品似乎成了常有话题。新闻界的一些媒体和名记者、名
许国富,北京海淀区颐和园邮局投递员,28岁,党龄2年,从事投递工作10年。著有《瞎信字典》一书,他代为用户取汇款700多笔,代发信件42万封,当地居民都叫他“送上门的小邮局”。
有这样一个单位,成立刚3年,就成为市级“先进集体”。党支部被评为市农口基层党组织十面旗帜之一。它就是市水产总公司所属的京渔水产批发大厅。上月底,我来到这个位于卢沟
二○○七年七月二十三日近一段时间以来,由于一些新闻单位内部管理制度不健全,采编工作程序不规范,新闻从业人员管理不严,出现了个别记者策划制造虚假新闻,一些媒体刊播转载