摘要
一种融合经验价值动态评估的强化学习避撞控制方法,为解决当前智能驾驶控制策略样本利用率差的等问题。本发明涉及智能驾驶领域。本发明包括风险评估模块、经验样本分类模块、经验样本价值评估模块和经验池分配模块。其中,风险评估模块实时评估每个环境步的风险参数,经验样本分类模块根据风险参数将经验样本分类储存在安全、待观察和危险三个经验池中,经验价值评估模块实时动态评估经验样本的价值,并将三个经验池中的经验样本分别进行排序,经验池分配模块实时动态评估三个经验池的价值,确定三个经验池的抽取比例,传至智能体进行经验回放,更新安全通行策略,重复上述过程,直至获得最优的安全通行策略。
技术关键词
样本
避撞控制方法
强化学习方法
模块
障碍物
风险
驾驶控制策略
算法
车辆
动态
定义
车道中心线
参数
时序
网络
误差
前轮
传感器
系统为您推荐了相关专利信息
重构方法
粒子群算法
阵列
ReLU函数
温差发电系统
数据预测模型
神经网络模型
医学
样本
数据生成方法