论文部分内容阅读
可扩展标记语言(extensible markup language,XML)已经成为Web 上数据表达和数据交换的事实标准,Hadoop 已成为云计算和大数据处理典型支撑框架之一,基于Hadoop MapReduce 来实现XML查询处理十分必要。为了实现基于MapReduce 的XML查询处理,首先实现了区间编码、前缀编码和层次编码等3 种不同的XML数据编码方式,以此为基础来研究和实现基于MapReduce 的XML结构连接处理。为查询处理建立了代价模型,通过代价估算获得优化的查询计划树。最后开展了