论文部分内容阅读
生物医学图像是现代医学研究和临床诊治不可或缺的手段和工具。随着医学成像技术的发展,医学图像处理对高性能运算及海量存储的需求凸显。由于网格技术可为医学图像处理技术提供强大计算资源支持,为海量医学数据的安全存储和共享提供解决方案,网格在医学图像处理领域被广泛应用。但在实际应用中,网格环境下医学图像应用的数据管理水平及效率仍然较低,存在因文件不可用而引起文件传输错误的问题,大量运行于网格的医学图像应用中的作业因此失败。通过优化副本放置策略,可以提高网格中文件的可用性,但以提高文件可用性为目标的副本问题研究还很少见。本课题以虚拟成像平台上的数据管理服务为应用背景,围绕网格文件副本放置及文件可用性问题,重点研究了网格副本方法分类问题、文件可用性及作业成功率建模问题以及副本放置策略的度量问题,为优化网格环境下医学图像应用中的副本放置提供理论基础。本课题的研究成果,适用于网格环境下医学图像应用中的数据管理问题,也适用于网格系统其他应用中的类似问题,对研究云计算等分布式系统中文件可用性问题也具有借鉴意义。本课题主要研究内容如下:(1)为了研究副本放置对网格环境下医学图像应用中的文件可用性的影响,观察了运行于虚拟成像平台上的工作流的运行情况,提取并分析了副本放置、存储单元可用性以及作业运行状况等相关数据。数据分析的结果证明了适当的文件副本放置策略对提高虚拟成像平台上的文件可用性、降低网格中工作流的作业失败率具有重要作用。(2)为了揭示已有的网格文件副本方法的分布特点和应用规律,对副本方法分类进行了研究,完善副本方法分类体系。在已有副本方法分类研究基础之上,应用资源描述框架(RDF)的方法描述副本问题,给出一个副本方法分类体系。应用这一分类体系对已有的副本方法以及网格上医学图像应用所需副本方法进行量化分析,结果表明,基于RDF的副本方法分类体系是一个可被观察和测量的分类系统,可以用来揭示副本方法研究成果的分布特点以及应用规律。(3)为了揭示文件可用性与网格作业成功率之间的关系,研究了文件可用性及作业成功率建模问题。在总结已有文件可用性研究成果的基础上,提出文件可用性的无状态模型和有状态模型。以此为基础,综合考虑副本放置方法和文件可用性模型,建立了作业成功概率模型,确定了作业成功率与副本放置以及存储单元可用性之间的关系。理论分析表明,与无状态模型相比,有状态模型可以更全面地反映文件副本个数及其放置策略对文件可用性以及作业成功率的影响。实验表明,作业成功概率模型是可靠的;与无状态模型下的作业成功概率模型相比,有状态模型下的作业成功概率模型更接近现实中生产网格环境下医学图像应用中的作业成功率。(4)为了研究网格文件副本放置策略的度量方法,应用系统脆性理论分析了生产网格中的副本问题,引入作业系统脆性风险熵模型作为副本放置策略的测度函数。作业系统脆性风险熵兼顾系统中存储单元状态组态的不确定性以及作业因文件不可用而失败的可能性,定量表示了副本放置策略与作业失败风险之间的关系。理论分析表明,综合应用作业系统脆性风险熵模型和作业成功概率模型,可以更清楚地揭示出副本放置策略与作业成功概率之间的关系,这为进一步研究网格文件副本放置策略优化以解决网格环境下医学图像应用中的数据传输问题提供了理论基础。实验结果表明,以作业系统脆性风险熵作为副本放置策略的度量方法是可行的。