摘要
本申请涉及一种车辆换道决策控制方法、装置、设备和存储介质。所述方法包括:获取目标车辆的当前状态信息,当前状态信息包括目标车辆的运动状态和目标车辆预设范围内其他车辆的运动状态;根据当前状态信息确定双经验回放缓冲区,双经验回放缓冲区用于存储多组规则经验和多组交互经验,规则经验根据当前状态信息和预设控制规则确定,交互经验根据当前状态信息和初始决策模型确定;根据双经验回放缓冲区和强化学习算法对初始决策模型进行训练,得到决策模型;根据当前状态信息和决策模型确定目标控制策略。采用本方法能够提高控制策略确定的效率和准确性。
技术关键词
控制策略
强化学习算法
车辆
决策
信号
转向角
速度
运动
规划
系统为您推荐了相关专利信息
性能预测模型
负载特征
策略
随机梯度下降
监控模块
新能源充电桩
样本
异常信息
充电桩故障
风险预测模型
模式构建方法
药代动力学参数
药物
患者
数据下载功能