论文部分内容阅读
图割算法作为求解马尔科夫随机场(条件随机场)能量函数的最重要的工具之一,近三十年来,学术界对其快速计算以及在能量函数优化中的应用进行了深入研究,并取得了丰硕的成果。近年来,视觉问题的规模越来越大,对应的能量函数往往包含更多的变量以及(或)具有更大的变量取值空间,这对于图割算法的求解效率以及处理大规模数据的能力提出了更高的要求。同时高阶能量函数的出现在增强其模型表达能力的同时也大大增加了其求解的难度,使得探索构造能够利用图割进行高效求解的高阶能量模型也成为了一项重要的研究内容。本文针对上述两个问题进行了系统研究,主要工作包括: 1.提出了一种具有收敛性保证的并行及分布式图割算法。基于图割的伪布尔代数表示,提出了一种对子图进行合并的方法,从而解决了利用对偶分解的并行图割算法由于图割固有的多解性造成的不具有收敛性保证的缺陷。并在此基础上提出了一种通用的动态并行图割计算框架。在该框架的每一次并行迭代中,可进行任意的子图分解及合并。从而使得在并行图割的计算过程中能够动态的调整并行的粒度及负载的均衡。 2.针对动态马尔科夫能量模型,提出了一种并行及分布式的动态图割算法。该算法通过更新并行图割计算得到的所有子图的残余网络,使得他们能够表示一个新的、类似的并行图割问题,并在新的并行计算中能够重用上一次并行图割计算得到的原问题及对偶问题的解以及所有子图上的流。相对于传统的并行图割算法及动态图割算法,本文提出的并行及分布式的动态图割算法在一些动态马尔科夫问题,如视频分割和GrabCut,上的计算效率上得到了很大的提升。 3.提出了一种基于图割的、鲁棒的约束物体检测和语义分割类别一致性的高阶能量模型。该高阶能量模型在接受和拒绝物体检测器时均能对物体检测和语义分割之间的类别一致性提供有效的约束,且对由于定位不准造成的错误物体检测具有鲁棒性。同时,该高阶能量模型在α-expansion下的move energy仅需添加少数的辅助变量即可使用图割进行计算,具有很高的计算效率。利用该高阶能量模型可同时得到场景的具有语义一致性的分割和检测结果。 本文针对静态图割和动态图割问题提出的并行算法均具有较高的计算效率以及收敛性的保证,这使得他们在视觉问题的应用上具有广泛的适用性。而基于图割的高阶能量模型是一种通用的约束区域一致性的高阶能量模型。因此本文的工作进一步提高了图割算法的求解效率以及基于图割的能量模型的模型表达能力。