摘要
本发明属于路径规划技术领域,具体提供了一种基于注意力机制的多智能体路径规划方法,包括以下步骤:S1:选取路径规划训练数据,构建训练集;S2:利用注意力机制分别设计编码器与解码器,构建基于编码器‑解码器结构的路径规划模型;S3:设计基于回滚基准的强化学习框架,构建面向多智能体任务的奖励函数;S4:将S1所得到的数据集输入S2所构建的路径规划模型,使用S3所设计的强化学习框架对路径规划模型进行训练,将训练好的模型应用于多智能体自主路径规划。本发明利用编码器获得节点高维特征表示,利用解码器计算概率分布,并采用结合回滚基准的强化学习框架对模型进行训练,降低了多智能体路径规划成本,提升了路径规划质量。
技术关键词
强化学习框架
注意力机制
节点
面向多智能体
编码器
解码器结构
矩阵
构建训练集
参数
网络
路径规划技术
输出特征
样本
基准
系统为您推荐了相关专利信息
分布式共识
双层网络结构
密钥协商算法
信誉值计算方法
资源
软件授权方法
时间段
软件授权系统
K均值聚类算法
节点特征
特征提取网络
特征提取模型
遥感图像地物
编码器单元
编码器模块
智能调度系统
无人机基站
加氢
电池热管理
中继天线
时序遥感图像
图像级标签
密集特征
变换器
分割方法