摘要
本发明涉及汽车生态驾驶领域,具体涉及一种基于专家优先的多智能体深度强化学习的驾驶控制方法、系统、设备及存储介质;包括以下步骤:包括构建仿真环境,加载训练数据;构建两个智能体ACC和EMS,并搭建Actor、Critic网络及目标网络;训练生态驾驶策略,训练时会引入专家知识和经验回放,生成驾驶策略,将驾驶策略加载网络参数至整车控制器,实现在线应用。本发明提出基于专家优先的训练方法,能将专家知识融入多智能体深度强化学习过程中,通过构建一个优先化的经验回放机制,确保那些包含专家智慧的关键经验能够被更频繁、更有效地利用,使得智能体能够更快地收敛至更优策略,实现驾驶性能的显著提升。
技术关键词
驾驶控制方法
深度强化学习
车辆动力系统
加速度
网络
双行星齿轮
表达式
驾驶控制设备
整车控制器
发动机
驾驶控制系统
智能驾驶员
强化学习策略
发电机
定义
离线
制动减速度
系统为您推荐了相关专利信息
程序动态更新
加载器
计算机程序产品
知识图谱查询
可读存储介质
排序方法
排序模型
时间卷积网络
序列
工单管理系统
传感器网络优化部署方法
三维空间监测
障碍物
粒子
无人机集群组网
联合预测方法
数据
电池隔离电路
线性回归模型
电池组