论文部分内容阅读
智能车辆是集环境感知与认知、动态规划与决策、行为控制与执行等多项功能于一体的综合智能平台。战术级的智能驾驶行为决策是当前阶段智能车辆发展的关键。以仿真实验平台为基础,以强化学习算法为工具,研究具有高水平自适应能力的智能车辆驾驶行为决策,不仅对保证车辆行驶安全,提高智能车辆复杂环境下的决策能力,具有更好的环境适应性至关重要,更对实现智能车辆真正上路,进行无人干预的自主决策具有重要的理论意义与现实意义。汇入行为的优劣影响道路行驶安全和通行能力。面对复杂城市环境,传统基于规则的汇入决策模型容易出现自适应环境行为决策能力不足。针对这一问题,本研究首先通过PreScan搭建复杂城市环境下的虚拟仿真实验平台,选取驾驶员进行虚拟仿真实验,通过粗糙集等算法进行行为决策数据预处理;利用强化学习中的Q-learning算法对跟驰、换道、汇入行为进行研究,综合考虑车辆运行规律、安全性、舒适性、汇入时机选择等因素进行回报函数(Reword function)设定;利用神经网络算法泛化值函数(Q值)以提高Q-learning算法解决连续性状态空间决策能力。然后尝试通过两层Q-learning算法,将驾驶员个体因素考虑到行为决策中,进一步提高基于Q-learnig算法对驾驶员个体的自适应能力,最后对智能车辆汇入行为决策算法的泛化、有效性进行验证。研究结果表明,采用强化学习Q-learning算法,能够提高复杂城市环境中智能车辆自适应环境的汇入行为决策能力。研究结果可以为智能车辆复杂环境下真实上路行驶提供理论和技术支撑。