论文部分内容阅读
在云计算的多数据中心环境下,数据密集型应用往往涉及跨数据中心的数据传输和数据中心内的数据迁移,这对数据分布提出了新的挑战。文中提出了一种云计算环境下面向数据密集型应用的数据存储方法,该方法将数据集映射成数据空间的点集,并设计了两阶段分类过程,第1阶段基于传统的K均值算法实现点集的初始分类,第2阶段针对各数据集与初始聚类的隶属关系,引入数据迁移的代价函数,对初始分类进行调节,实现数据集到数据中心的布局方案。实验表明,该算法能够有效地提高数据存取效率和兼顾全局负载均衡。