摘要
本发明提供了一种融合图神经与强化学习的车辆编队控制方法,包括:构建车辆间的图结构模型,利用图注意力网络提取当前车辆与邻居车辆之间的结构化交互特征,并结合长短期记忆网络建模历史时间步的动态演化特征,预测未来时刻的邻居聚合状态。采用卷积神经网络对车辆传感器获取的二维反射图像进行处理,提取周围环境的空间语义信息。通过融合车辆自身状态、邻居特征与环境特征,作为策略输入,基于多智能体深度确定性策略梯度算法进行联合训练,采用集中式价值网络与分散式策略网络结构实现端到端控制策略优化。本发明提高了编队系统的智能化决策水平,具备良好的环境适应能力与协同控制性能。
技术关键词
车辆编队控制方法
长短期记忆网络
CNN网络结构
卷积神经网络提取
策略
节点特征
邻居车辆信息
多层卷积神经网络
雷达传感器
加速度
交通状态信息
注意力机制
车道结构
车辆传感器
系统为您推荐了相关专利信息
道路拓扑数据
行走控制方法
指示机器
调控策略
控制指令生成单元
多源异构数据
风险评估报告
风险监测方法
链路
智能关联分析
电子围栏设备
安全控制方法
视频监控设备
视频监控数据传输
异常事件
燃气轮机
粒子群算法
储能装置容量
光伏发电机组
粒子群参数优化
交直流混合微电网
储能装置
模糊决策方法
数字孪生模型
粒子群算法