【摘 要】
:
Pontryagin,Boltyanski,Gamkrelidze 和 Mischenko[46]研究了确定性系统的最大值原理,给出了最优控制满足的必要条件。随后,Kushner[33,34]利用Girsanov方法得到了连续参数下随机系统的最优控制的必要条件,Haussmann[50]给出了在扩散系数不依赖于控制的情形下更一般的随机最大值原理。后来又有很多学者进一步研究了 Pontryagin型
论文部分内容阅读
Pontryagin,Boltyanski,Gamkrelidze 和 Mischenko[46]研究了确定性系统的最大值原理,给出了最优控制满足的必要条件。随后,Kushner[33,34]利用Girsanov方法得到了连续参数下随机系统的最优控制的必要条件,Haussmann[50]给出了在扩散系数不依赖于控制的情形下更一般的随机最大值原理。后来又有很多学者进一步研究了 Pontryagin型的随机最大值原理,即主要在控制域为凸集的假设下得到相应的随机最大值原理。Peng[44]首次给出了克服这一困难的方法,得到了在控制域不一定为凸集且扩散项系数可以依赖于控制情形的随机最大值原理,称为Peng的随机最大值原理。Buckdahn,Djehiche和Li[13]研究了一类平均场随机微分方程(SDE)的随机控制问题,得到了 Peng的随机最大值原理。Buckdahn,Li和Ma[15]进一步研究了方程系数依赖于状态变量的分布时的Peng的随机最大值原理。随机最大值原理,尤其是平均场情形下的随机最大值原理,大部分工作都是假设系数满足Lipschitz条件。本文的创新之处是弱化Lipschitz条件,研究单调性条件下,平均场情形的相应的Pontryagin和Peng的随机最大值原理。这种推广,不局限于假设漂移项系数关于状态变量满足单调性条件,同时也假设其关于分布也满足单调性条件。本文的第一部分首先研究了单调性条件下平均场随机受控系统的随机最大值原理,其中随机受控系统形式如下:(?)(1)使得以下代价泛函最小的控制u(·)称为最优控制:J(u(·))=E[∫T0f(t,xu(t),E[xu(t)],u(d))dt+h(xu(T),E[xu(T)])].(2)我们的目的是研究最优控制u(·)满足的条件。我们假设方程(1)的漂移项系数关于变量x,y均满足单调性条件,即:(b(t,x1,y,u)-b(t,x2,y,u))(x1-x2)≤α|x1-x2|2,α>0,(b(t,x,y1,u)-b(t,x,y2,u))(y1-y2)≤β|y1-y2|2,β>0.为了研究此条件下的随机最大值原理,本文证明了单调性条件下平均场随机微分方程(1)解的存在唯一性和各种估计,这是本文的难点之一。然后假设控制域为凸集,利用凸扰动的技巧,给出了一种局部形式的Pontryagin型的随机最大值原理,并举例说明。进一步,当控制域不一定为凸集时,利用1990年Peng[44]所提出的方法,我们考虑二阶变分方程和相关二阶伴随方程,证明了 Peng的随机最大值原理,同时给出了一个例子。本文的第二部分研究了当平均场随机微分方程系数依赖于状态变量分布时的随机最大值原理。考虑如下受控的随机微分系统:(?)(3)此时方程系数不仅依赖于状态变量,还依赖于它的分布。给出以下代价泛函:(?)(4)记u*是使得以上代价泛函最小的最优控制。我们假设方程(3)的漂移项系数关于变量x,μ分别满足以下单调性条件:(b(t,x1,μ,u)-b(t,x2,μ,u))(xi-x2)≤α|x1-x2|2,α>0,(b(t,x,PY1,u)-b(t,x,PY2,u))E[Y1-Y2]≤β(W1(PY1,PY2)2,,β>0.首先证明此条件下方程(3)的解的存在唯一性以及所需估计。然后,利用凸扰动和对偶的技巧,证明了 Pontryagin型的随机最大值原理。最后,在控制域不一定为凸集的假设下,利用针状变分得到了所需估计并证明了 Peng的随机最大值原理。本部分的难点主要在于需要对相关函数关于测度求导并得到相关的各种估计。不同于经典情形的是,这里的伴随方程是满足单调性条件的平均场倒向随机微分方程(BSDE),本文也证明了其解的存在唯一性。
其他文献
目的调查急诊科护士感知的医护合作现状,分析人口学因素、一般自我效能感、任务负荷、医护人际交换、护士执业环境对医护合作的影响,为管理者从护士个人和执业环境两方面采取措施促进医护合作提供参考。方法2020年9月~11月,通过便利抽样的方法,选择济南市的8所三级甲等医院的326名急诊科护士进行调查。研究以一般资料调查表、医护合作量表、任务负荷指数量表、一般自我效能感量表、医护人际交换问卷、护士执业环境测
科技为现代生产力发展提供重要驱动,金融为实体经济做大做强提供有利支撑,科技金融作为科技与金融有机融合的产物,是我国培育战略性新兴产业、建立创新型国家的重要战略,对提升经济发展质量,促进国民经济实现整体良性循环具有重要意义。在经济新常态阶段,只有以科技引领金融创新,以创新驱动区域经济发展,充分发挥科技和金融有效融合的发展机制,才能更好的推动我国经济的高质量发展。我国在“十四五”规划中也明确提出“要贯
引言:近年来,针对教育活动中所存在的各种问题,国家层面提出了素质教育改革的理念。在具体的落实过程中,需要结合学生的特点、课程特点以及教材特点等相关性内容进行有效、针对性调整。而在培智学校的小学数学教学活动中,也需要贯彻落实该理念。从学生身心发展特点出发,考虑到教材内容的影响,并将数学问题进行生活化处理,调动学生在课堂上的积极性和主动性。当前阶段,该部分的内容已经成为了诸多小学数学教师所重点关
火星是太阳系中与地球环境最类似的行星,是我国开展深空探测的重点目标。2020年7月23日,我国首次火星探测任务“天问一号”探测器成功发射,计划完成“绕、落、巡”三大目标。此次任务有两个预选着陆区,分别是克里斯平原(预选着陆区1)和乌托邦平原南部(预选着陆区2)。火星尘暴是指火星表面尘埃在剧烈的大气运动下形成的尘暴现象,发生在火星的所有季节,是火星最重要的大气活动之一,对探测任务造成的威胁诸多。火星
目的:1、以宫颈癌患者作为研究对象,针对其支持性照顾需求情况进行横断面调查,同时对其中的影响因素进行分析。2、以Kano模型为理论基础,对宫颈癌患者支持性照顾需求的评估工具进行属性分类,根据属性分类、重要度以及满意度结果,识别支持性照顾需求评估工具的核心项目,以期为临床护理个性化干预方案的制定提供依据,为临床护理工作开拓思路,从而丰富宫颈癌患者优质护理服务的专业内涵。方法:1、本研究应用便利抽样法
火星上大规模频发的沙尘现象(例如尘卷风和沙尘暴)中因矿物颗粒间的摩擦碰撞会产生强电场。该电场极有可能击穿低气压、低电导率的火星大气,诱发等离子体电化学反应并对大气组分和表面物质产生重要影响。由于缺少就位测量手段,目前还未发现火星表面放电现象的直接证据及相关报道。进行实验室模拟研究是探究火星大气放电过程及其反应机理的重要手段。本研究在模拟的火星环境下,通过系统研究实验参数对反应产物种类、产物产率及可
随着科学技术的发展,人们对半导体材料尤其是TCO薄膜的性能提出了越来越高的要求。而p型TCO由于其电导率低、可见光透过率低的缺点,使其无法与n型TCO结合从而拓宽其应用场景。因此大幅提升p型TCO的光电性能成为了研究人员关注的热点。铜铁矿氧化物是目前制备p型TCO的热门材料,CuCrO2作为铜铁矿氧化物的一种,有着良好的本征空穴电导率、可见光透过率以及适合空穴导电的晶体结构,使其成为一种极具应用潜
近年来,随着城市化进程的加快,我国城市空间结构发生了很大的改变,进而引起了地表形态的变化、生态环境及全球变暖等现象。因此,及时、准确、客观地评价影响地表温度空间分布特征驱动因素,有助于更好地规划城市、建设生态环境,并促进可持续发展。本文选取山东省作为研究区域,利用搭载于Terra星上的MODIS得到的地表温度产品(MODIS11A2)、MODIS 01B产品、土地分类产品(MODIS12Q1)及植
目的:探讨冠状动脉搭桥患者术后疲劳现状及其影响因素,分析术后疲劳对患者早期下床活动及住院时间的影响,为改善冠状动脉搭桥患者术后疲劳,优化冠状动脉搭桥术后患者护理提供参考。方法:采取便利抽样法,选取2020年1月—2020年8月入住某三甲医院心脏外科病房行冠状动脉搭桥手术的312名患者为研究对象。采用一般资料调查表、中文版多维度疲乏症状量表-简表(MFSI-SF-C)、面部疼痛表情量表(FPS-R)
日冕是太阳大气的最外层,对其进行成像和光谱观测对于太阳大气物理研究和空间天气预报都非常重要。通过地基或空间日冕仪观测日冕,需要准确测量日冕光度值,从而反演等离子体电子密度等参数随日心距的变化,以研究日冕加热和太阳风加速、CME等的物理机制以及太阳爆发活动的强度和演化规律,为空间天气预测提供准确的科学数据。本论文针对“子午工程二期”新建设备-光谱成像日冕仪的光度校准开展关键技术研究和日冕仪光度计设计