论文部分内容阅读
目前,城市交通拥堵现象严重,它已是城市治理最棘手的问题之一。交通拥堵意味着车辆需要频繁地启动、刹车,这不仅会使得驾驶员变得疲劳且烦躁易怒,容易出现交通事故;又会大大增加车辆的尾气排放量,从而降低城市的空气质量,加剧城市“热岛效应”。车辆自动跟驰技术不仅可以降低驾驶员的驾驶强度、缓解驾驶员的情绪,而且可以使整个交通流变得有序,有利于降低交通拥堵的时间,改善城市交通状况。因此,研究和发展这样的驾驶技术具有重要的理论意义和应用价值,论文主要进行了如下研究:(1)理论驱动低速跟驰模型的建立:对Gipps模型、全速度差(Full Velocity Difference,FVD)模型、智能驾驶者模型(Intelligent Driver Model,IDM)进行了参数标定与分析对比,三者在安全度上差异不大,而IDM模型在舒适度上远好于其它两个模型,因此以IDM模型为基础建立理论驱动低速跟驰模型,针对原IDM模型车辆起步过缓的问题进行了一定优化。(2)数据驱动低速跟驰模型的建立:以美国NGSIM(Next Generation Simulation)交通数据集经一定处理后所得的低速跟驰数据集为数据来源,基于径向基函数神经网络(Radial Basis Function Nerual Network,RBFNN)建立了数据驱动低速跟驰模型,模型预测结果能够准确地贴近真实值;同时将该模型与IDM低速跟驰模型进行了对比分析,为了融合二者的优势,通过最优加权法建立了IDM-RBFNN低速跟驰组合模型,该模型取得了比单一模型更佳的预测效果。(3)车辆低速跟驰决策算法的研究:以深度强化学习(Deep Reinforcement Learning,DRL)算法中的深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法与信赖域策略优化(Trust Region Policy Optimization,TRPO)算法为基础,通过障碍控制方法(Control Barrier Functions,CBF)对二者进行了改进,在车辆低速跟驰对比实验中分析各算法的决策性能,最终得出TRPO-CBF算法性能表现最佳,因此选择该算法作为后续仿真实验的低速跟驰决策算法。(4)车辆低速跟驰仿真实验的设计与分析:基于Carsim与Unity3D构建车辆低速跟驰决策的仿真实验平台,依据低速跟驰数据集中的真实数据在实验场景中模拟前车的运动,通过TRPO-CBF算法控制智能车对前车的跟驰运动,并以IDM-RBFNN低速跟驰模型作为算法的决策目标,最终在实现算法决策训练过程可视化的同时证明了TRPOCBF算法能够有效收敛于目标策略。