【摘 要】
:
为解决依赖受控系统数学模型而导致的数据驱动控制性能不完善,控制跟踪结果误差较大的问题,提出一种基于近似Q-学习算法的数据驱动控制方法。为使Q被充分学习,在时间轴的立即回报序列上估计训练值,因此修改确定性规则,使其采用当前Q值和修正后估计衰减值计算加权平均值计算,实现算法收敛。采用以Q-学习算法为结构的控制器代替受控数据当前工作点的一般非线性模型,并且仅使用被控对象提供的数据来评估模型中的伪偏导函数
【机 构】
:
桂林电子科技大学花江校区电子工程与自动化学院
论文部分内容阅读
为解决依赖受控系统数学模型而导致的数据驱动控制性能不完善,控制跟踪结果误差较大的问题,提出一种基于近似Q-学习算法的数据驱动控制方法。为使Q被充分学习,在时间轴的立即回报序列上估计训练值,因此修改确定性规则,使其采用当前Q值和修正后估计衰减值计算加权平均值计算,实现算法收敛。采用以Q-学习算法为结构的控制器代替受控数据当前工作点的一般非线性模型,并且仅使用被控对象提供的数据来评估模型中的伪偏导函数,实现无模型数据驱动控制。仿真结果证明,所提方法的信号扰动较小,且控制跟踪结果误差较小,整体性能要优于传统方法。
其他文献
随着我国市场经济体系的日益完善,企业运营管理中所涉及的财务数据越来越复杂,而将大数据技术优势运用到财务管理活动中,不仅可以确保数据真实可靠、提高精准度,而且工作效率大幅度提升,企业资源实现了优化配置,生产成本降低,这些是传统财务会计所无法相比的。在大数据环境下,企业财务会计向管理会计转型已迫在眉睫,既满足企业发展需求,同时又有利于经济效益的提高。文章重点针对大数据环境下财务会计向管理会计转型策略进
兔抗m~7GMP血清与烟草花叶病毒(TMV)制剂反应能产生免疫沉淀、并抑制TMV的感染力达90%以上。32pCp在RNA连接酶作用下与TMV制剂反应,分离32p标记的TMV再经过核糖核酸酶(RNaseT2)水解,电泳分离得到32pm~7G5′ppp5′Gp,这些结果说明TMV病毒颗粒中的RNA的5′-端帽子结构可能暴露在病毒颗粒的外部,因而容易与抗m~7GMP血清及32pCp反应,同时也说明TMV
随着当今社会发展的不断进步,对人才的要求也越来越高。教师帮助学生有一个良好的预习习惯,不仅能够为学生在以后的课堂学习奠定坚实的基础,同时,对学生自主学习能力的提高以及学习积极性的调动也发挥了重要作用。在小学阶段,预习是一个比较好的自主学习方式,预习让学生对将要学习的知识进行了解和分析判断,激发学生学习新知识的欲望,进而实现学生的有效预习。
1背景、目的及意义慢性阻塞性肺疾病(chronic obstructive pulmonary disease, COPD,简称慢阻肺)是一种常见、可以预防和治疗的慢性气道疾病,以持续存在的呼吸系统症状和气流受限为特征,通常因明显暴露于有毒颗粒或气体引起以气道和肺泡结构遭到破坏所致。慢性阻塞性肺疾病急性加重(acute exacerbation of chronic obstructive pul
目的 汉化儿科患者心理社会风险评估(Psychosocial Risk Assessment in Pediatrics,PRAP)量表,并检验其信效度。方法 获得原作者授权后进行翻译、文化调适,形成中文版PRAP量表。采用便利抽样法,选取2021年3月—5月于上海市某三级甲等儿童专科医院住院的167例患者进行心理社会风险评估,检验量表的信效度。结果 中文版PRAP量表包括性情、诊疗环境中的焦虑和
嗑CP,表面看起来嗑的是CP两人,其实嗑的都是我们真实生活中情感的投射。我们羡慕强者,也欣赏权力平等、相处甜蜜的爱情,所以在书籍、影视剧中嗑又甜又强的CP,就成了我们寄托美好期望的方式。《你是我的荣耀》大结局了,航天设计师于途和女明星乔晶晶的爱情甜倒了一众网友。两人不仅甜,还都热爱工作,于途科研忙碌,加班是常态,回家还要写论文。乔晶晶的敬业人设也屹立不倒,坚持用作品说话。
空腹夹层板结构的U形钢板-混凝土组合下肋梁采用装配化施工时,将拼接节点设置于跨中位置具有受力明确、施工方便的优点,但拼接节点处的较大拉力也使其成为整个结构的薄弱区域.为研究U形钢板-混凝土组合下肋梁拼接节点的力学性能,设计了5组U形钢板-混凝土组合梁拼接节点足尺试验模型,开展了拉力荷载下的静载试验,通过与有限元模型进行对比分析,明确了拼接节点在拉力作用下的内力分布规律与破坏模式,揭示了栓钉布置形式
严重大面积烧伤病人,自体皮常常不足,不得不寻求其他生物敷料。冻存异体皮移植于创面可与创基建立血管,良好地封闭创面,防止感染与创面水分蒸发,减少超高代谢。我科自1998年底建立皮库,临床应用冻存异体皮面积达4840000cm~2,活力达到新鲜皮肤的70%左右,皮肤质地色泽与新鲜皮一样,临床