基于深度强化学习的城市区域交通信号控制研究

来源 :福建工程学院 | 被引量 : 1次 | 上传用户：ziguangguo

【摘要】

：

进入21世纪以来,我国的城市化、机动化进程不断加快,小汽车保有量保持较快增长,导致交通拥堵、能源危机、环境污染等问题日益明显。交叉口作为交通咽喉,是发生交通拥堵的主要

【作者】

：

刘洁锐

【出处】

：

福建工程学院

【发表日期】

：

2020年01期

【关键词】

：

交通信号控制智能交通系统深度学习强化学习 DQN算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

进入21世纪以来,我国的城市化、机动化进程不断加快,小汽车保有量保持较快增长,导致交通拥堵、能源危机、环境污染等问题日益明显。交叉口作为交通咽喉,是发生交通拥堵的主要区域。城市交通信号控制作为交叉口时间资源和空间资源协同优化的方法,是智能交通系统的重要方向。强化学习作为一种探索性机器学习方法,是提高交叉口通行能力的有效手段。为此,本文研究了基于深度强化学习的交通信号控制方法,完成的主要工作如下:1.提出基于深度强化学习深度Q网络(DQN)的改进算法,使用多进程的方法,将训练神经网络和仿真环境并行进行,同时构建多个仿真环境,这些环境会并行的产生数据并放入经验池中,与传统的DQN算法相比,该方法会加速经验池产生的数据量,并提高神经网络的训练速度。2.使用改进的DQN算法应用于单点信号控制模型中。在强化学习中,提出状态,动作和奖励的表示方法。使用LSTM网络用于拟合状态和Q值的函数。并将结果与定时信号控制进行比较,结果表明,在一定的交通条件下,该算法使交叉口的通行能力提高了14.28%。3.结合了单点信号控制算法,将多智能体的深度强化学习算法运用到区域信号控制中去。在单点控制的方法的基础上,进一步改进状态、动作、奖励的表示方法,应用到区域信号控制中去。同时,为了解决不同交叉口的信号协调控制问题,提出在每个交叉口加入一个控制器????聄冴?.冴?,每个控制器分别独立地控制对应交叉口绿灯和黄灯的变化。结果显示,在与实际信号相位的控制中,使用多智能体信号控制方法在通行能力、停车延误和交叉口平均排队长度的表现均更优。

其他文献

高位小肠间质瘤误诊为子宫阔韧带肌瘤一例

患者女,49岁,因超声发现子宫肌瘤4年,阴道出血8d于2012年1月29日入院.患者平时月经正常,近半年月经不正常,1～2个月一次,7年前曾行子宫肌瘤剥出术,4年前超声发现子宫肌瘤,大小

期刊

三维时间飞跃法磁共振血管成像与数字减影血管造影诊断基底动脉狭窄的一致性分析

目的使用统计学方法评估三维时间飞跃法磁共振血管成像(3D TOF MRA)和金标准数字减影血管造影(DSA)诊断基底动脉狭窄一致性.方法回顾性分析70例基底动脉狭窄患者的3D TOF MR

期刊

椎底动脉供血不足磁共振血管造影术血管造影术数字减影Vertebrobasilar insufficiencyMagnetic resonance ang

2015年安宁市从业人员携带沙门菌血清型及药敏分析

目的了解云南省安宁市2015年食品和公共场所行业从业人员沙门菌菌型分布状况与耐药情况。方法选取2015年18 121人份肛拭标本进行肠道菌增菌、分离、生化及血清学分型鉴定和药

期刊

沙门菌血清型耐药性

浦发银行重庆分行运营管理提升研究

商业银行作为现代金融业的核心,在整个经济发展中具有举足轻重的作用。本文以浦发银行重庆分行作为研究视角的切入点,通过专家访谈法、实地调研法和文献研究法等,发现浦发银

期刊

浦发银行重庆分行运营管理

基于深度强化学习的城市区域交通信号控制研究

其他学术论文