论文部分内容阅读
本文共分为六章:
第一章为综述,简单介绍了离散时间随机对策的历史背景、研究内容、发展现状以及本文的研究目的和主要结果.
第二章讨论可数状态空间离散时间零和随机对策模型,我们所用的最优性准则是期望折扣赔付准则和平均期望赔付准则.赔付函数可能既无上界又无下界.在期望折扣赔付准则下,利用”漂移”和”连续一紧性”条件,通过构造最优性算子和巧妙地选取迭代序列,得到了令人满意的折扣最优值的逐次逼近算法,进而给出折扣最优平稳策略的存在性.据我们所知,对于可数状态空间离散时间期望折扣赔付模型,这个算法是新的,因为以往文献并没有给出在状态空间可数、紧行动空间、赔付函数可能无界情况下,折扣最优值的具体计算方法.另一方面,在下一章对Bord空间离散时间随机对策模型的讨论中,我们证明了这个算法也适用于Borel状态空间、紧行动空间、赔付函数可能无界的模型,从而我们彻底地推广了以往文献中折扣赔付准则的研究结果.在平均期望赔付准则下,通过“漂移”、“连续一紧性”以及我们的核心条件一折扣最优值函数的相对差仅对折扣因子有界,我们得到了平均最优方程的解的存在性,进而得到平均最优值函数和平均最优平稳策略的存在性.此外,我们证明了本章所用的最优性条件不仅区别于以往文献中的最优性条件,而且更弱于以往文献的条件.最后,我们用一个受控的排队系统模型来说明本章的条件和结果.第三章讨论了Borel状态空间零和随机对策模型,并将第二章可数状态空间上的大部分相应结果推广到Borel状态空间上.但与第二章和以往关于Borel状态空间平均模型不同的是,我们首次提出了”最优-双不等式方法”,并且给出了这两个最优不等式的解存在的新的最优性条件,最后通过这两个不等式得到平均最优平稳策略的存在性.此外,在本章的最后,我们通过存储系统和受控的人口过程这两个实例更进一步地阐明”最优-双不等式方法”比传统的”最优方程方法”的优越性.
第四章研究Borel状态空间零和随机对策平均样本轨道模型.我们首先给出了一组保证平均样本轨道赔付最优平稳策略存在的新的最优性条件,然后在我们的新条件下利用现代随机分析中的鞅方法,证明了平均样本轨道最优平稳策略的存在性.本章我们所用的最优性条件明显弱于以往文献中的相应条件,而且我们能够证明在我们的条件下一样可以得到平均样本轨道最优平稳策略的存在性,因此推广了以往文献中的相应结果.特别说明的是随机单调性条件首次被用来研究零和随机对策平均样本轨道赔付准则的最优性问题.最后,我们用一个受控的人口过程来说明我们的主要结论.
第五章讨论可数状态空间非零和随机对策期望折扣赔付准则模型.在状态空间可数和赔付函数可能无界情况下,利用零和随机对策模型中的“漂移”和“连续一紧性”条件,通过Fan’s不动点定理我们证明了期望折扣赔付准则Nash平衡点的存在性.我们的条件不同于以往文献中的转移概率μ-连续或转移概率可分性条件,同这两种条件相比,我们的条件要明显弱于它们,因此我们推广了以往文献中的相关结果,使得非零和随机对策期望折扣赔付准则的最优性条件更为一般化.
第六章简单总结了本文所作的工作,并介绍了一些离散时间随机对策模型上有待解决的问题.