基于强化学习的城市交通区域协调控制研究

来源 :电子技术 | 被引量 : 0次 | 上传用户:qb54223322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通控制系统是一个复杂的巨系统,传统的建模和控制方式难以获得较好的控制效果。文章针对区域协调控制中难以建立精确数学模型的特点,引入了强化学习,提出了基于强化学习的无模型区域协调控制算法。采用微观交通仿真软件对算法进行了仿真实验,与Webster定时控制进行对比,实验结果表明:强化学习算法取得较好的效果。 Traffic control system is a complex giant system, the traditional modeling and control method is difficult to get better control effect. In this paper, aiming at the characteristics that it is difficult to establish an accurate mathematical model in regional coordinated control, this paper introduces intensive learning and proposes a model-free coordinated control algorithm based on reinforcement learning. The simulation experiment is carried out by using the micro-traffic simulation software and compared with the Webster timing control. The experimental results show that the reinforcement learning algorithm achieves good results.
其他文献
《欲望号街车》(以下简称《街车》)是田纳西·威廉斯最经典的戏剧作品,一直以来吸引着人们从不同的角度去解读和研究。本文试图从原型理论的角度,分析《街车》女主人公布兰奇
本文拟从伽达默尔的哲学阐释学角度对林纾和张培均两位译者所译的两版《黑奴吁天录》进行描述性文本分析,以历史的有效性作为理论依据,从历史有效性的时间延异维度观察意义在空
《骨》是美国华裔作家伍慧明的成名作,也是她的第一部小说,讲述的是唐人街梁家在二女儿自杀后所经历的种种心理创伤与身份危机。《骨》在1993年首度出版后很快成为流行全美的
在外语教学中,尤其是在英语写作教学中,过程教学法主要被运用于过程教学法和结果教学的对比研究上。许多专家和外语教师通过理论研究和实际教学实验证明过程教学法是一种有效
文学作品的翻译不仅要再现原文的思想内容,而且不能忽视文学作品所独具特色的美学效果。因此如何在准确翻译原文主旨的基础上,同时尽可能达到跟原文相同的美学效果是文学翻译工
梁实秋作为一名著名的翻译家,因以一人之力翻译《莎士比亚全集》而备受瞩目。由于历史原因,他曾因文学阶级性方面的论断而饱受争议。基于30年代前后左翼学者的部分激进观点,
卡勒德·胡塞尼是一位用英语写作的阿富汗裔美国作家,他的第一部小说《追风筝的人》因其生动的人物角色、震撼的故事情节而获得巨大的成功。尤为值得注意的是,该小说涉及到流散
受翻译研究的文化转向和西方哲学由主体性向主体间性转向的影响,许多翻译学者重新思考了当前的翻译现状,将主体间性的概念引入到翻译研究中,认为翻译的主体间性是指参与到翻
煤炭工业南京设计研究院参考隧道施工先进支护技术,在兖州矿业(集团)公司小屯煤矿支护中优化格栅与钢支撑构件,达到了较好的支护效果。钢格栅系由普通建筑用钢筋经冷弯成型后
美国二十世纪女诗人伊丽莎白·毕晓普(1911—1979),一生创作数量不多,却获得过许多重要奖项,如普利策奖(1956),国家图书奖(诗歌)(1970)和国家图书批评家奖(1977)等,还曾于194