【摘 要】
:
设计时间序列数据在Hadoop分布式文件系统(HDFS)中的有效存储方式,利用分布式缓存工具Distributed Cache将各子序列分发到Hadoop集群的计算节点上,将动态时间弯曲距离矩阵划
【机 构】
:
广西大学计算机与电子信息学院,南宁530004
【出 处】
:
2016年全国开放式分布与并行计算学术年会
论文部分内容阅读
设计时间序列数据在Hadoop分布式文件系统(HDFS)中的有效存储方式,利用分布式缓存工具Distributed Cache将各子序列分发到Hadoop集群的计算节点上,将动态时间弯曲距离矩阵划分成多个子矩阵,采取并行迭代计算每条反对角线上子矩阵的方法,基于MapReduce编程模型,实现高效并行计算时间序列动态弯曲距离,通过改进剪裁冗余计算方法,设计实现一种数据流多模式相似性搜索并行算法.中国雪深长时间序列数据集的实验结果表明,当每条时间序列的长度达到5000以上时,并行计算动态弯曲距离所需时间少于串行计算所需时间,当每条时间序列的长度达到9000以上时,参与计算的集群节点越多,并行计算所需时间越少;当模式长度达到4000、参与计算的集群节点数达5个以上时,从数据流中并行搜索出与模式匹配的相似子序列所需时间约为串行搜索所需时间的20%.
其他文献
基于对两淮煤田煤系地层所测定的32块岩石样品的放射性生热元素(U、Th、K)结果,计算得出各个岩石样品的放射性生热率的大小;并全面报道了两淮煤田岩石放射性生热率参数及其特
针对通用无线传感器网络(WSN)平台无法满足无线智能水表抄表系统(SWWMRS)低成本、低功耗、高效和高可靠性等方面实际应用需求的问题,设计并实现了一种改进的无线智能水表抄表
针对传统的预付费水表缺乏便利性和实时性等问题,实现了一种具有移动支付功能和数据查询功能的近场通信(NFC)智能水表系统.首先,根据水表的预付费业务需求,设计了基于NFC技术
为了解决人群遮挡严重、光照突变等恶劣环境下人群计数准确率低的问题,提出基于混合高斯模型(GMM)和尺度不变特征变换(SIFT)特征的人群数量统计分析新方法.首先,基于GMM提取
为了提高机动车驾驶时的安全性,提出了基于计算机视觉的行车安全中车距估计与超车检测方法.首先,使用车辆阴影检测方法确定车辆位置,根据阴影位置和视觉中心点的距离建立车距
随着多核处理器技术的发展,缓存和主存作为多核处理器的共享部件已经成为影响系统性能的关键因素之一。针对传统静态枚举设置帮助线程控制参数值的繁杂耗时问题,提出了一种帮
针对现有车联网(VANET)中数据转发效率低的问题,提出了软件定义网络(SDN)的数据转发机制.首先,设计了软件定义车联网的分层次网络模型,该模型由局部控制器和车辆组成,实现控
针对将计算任务合理地映射到三维片上网络(NoC)的问题,提出了一种基于遗传算法(GA)的改进算法.GA具有快速随机的搜索能力,Prim算法可在加权连通图内得到最小生成树,改进算法
Navier-Stokes(N-S)方程是流体力学中最重要的方程之一。针对不可压缩Navier—Stokes(N-S)方程求解过程中的有限元法存在计算网格量大、收敛速度慢的缺点,提出了基于面积坐标
为提高软件即服务(SaaS)应用中资源的访问效率,提出支持SaaS服务重要特征的负载均衡策略.首先,结合SaaS服务的多租户和高度可伸缩两大特性,提出一种基于租户请求分流、在局部