论文部分内容阅读
马尔可夫随机场因结合局部信息与空间信息的特性,被广泛应用于机器视觉与图像处理相关领域中。然而马尔可夫随机场被证明是NP问题。随着MRF与Gibbs分布等价性的提出,使得计算变成可能。因此本文使用Markov随机场作为模型对图像进行基于色彩分割。然而原始Markov随机场的计算需要监督获得局部信息。为了解决此问题,本文使用基于Dirichlet过程的非监督贝叶斯模型来求局部信息。Dirichlet过程聚类算法实现贝叶斯混合模型,本算法的主要思想是使用概率混合模型来解释观测数据。每个观测数据被认为隶属于其中模型,然而并不确切知道属于那一个模型,在此情况下处理一个被称作隐参数问题,此隐参数用于指明观测数据是由哪一个模型随机产生的。然而具体如何确定模型的个数成为本问题的核心。若模型选择太少,此概率模型将不能表述复杂分布。反之,若模型选择过多,将产生过适定问题。因此使用Dirichle分布进行先验概率选择。Dirichlet分布是一个基于多参数的分布,可以看作beta分布的一般化形式。Dirichlet分布是分布的分布,也就是说从Dirichlet分布的采样序列属于离散分布空间。设模型的个数为K,当k→∞时DP依然成立。因为K的个数与观测数据的个数有关,故属于非参数估计。并且k的个数呈指数速度下降,因此通常不会产生过适定问题。在最优化问题中,本文使用blei的变分推导(variantional inference)方法处理DP混合模型问题,以使在可以接受的时间内,可以良好的处理图像的聚类问题。决定基于色彩的分割正确率一个重要步骤就是如何衡量两个像素视觉差距的测度函数,传统的方法是使用欧拉距离,然而作者认为这种方法不符合视觉习惯。通过色彩空间的观测与试验发现,相对于欧拉距离,两个像素之间的夹角距离扮演更重要的角色。然而夹角距离也存在其缺点,如在纯黑与纯白像素,若使用夹角距离计算,则会认为两个像素完全类似。为了克服上述问题,本文依据欧拉距离与夹角距离的性质,结合两者的特点设计一个基于夹角距离与欧拉距离的分布。并将此分布用于Dirichlet过程中作为分布模型。因为本文考虑到选择了更恰当的像素比较模型,并结合空间局部信息,实验证明本文提高分割的视觉效果。然而图像分割所需要处理的数据量巨大,在MRF中,本文讨论了Yuri Boykov的图切割算法的并行能力,设计并实现了其增长(Grow)和收养(Adopt)步骤的并行算法。在增长函数中本文使用分支界限法的广度优先搜索,并使用扩展终止线程函数,提升算法的执行效率,并在上述两个函数中调用OpenMP3.0新加入的任务(Task)功能,解决其不规则(Irregular)算法。对p个处理器,最坏情况的运行时间从原来的O(bd/2 +a+nr)缩短到O(bd/2 /p +a/p+nr/p)。分别在单核与双核与四核对多个能量函数的优化进行计算,实验证明此并行算法准确有效。