论文部分内容阅读
针对在大规模微博用户群中寻找并计算出最活跃的几个用户的活跃度非常耗时的问题,利用Hadoop系统框架的HDFS将数据分块存储的特性和整体数据分割后局部筛选最优可体现整体最优的特性,提出了一种结合MapReduce编程技术和堆排序技术的高效查询计算策略。并通过仿真实验,对该策略进行了模拟实现,实验结果证明了该策略可高效的计算出微群中最活跃用户的活跃度。