摘要
本公开提供的多智能体几何图强化学习方法,包括:各智能体通过其观察从全局动态环境状态空间中获取相应的局部状态,构建全连接的全局实体级几何图;引入基于几何距离度量的动态任务分配机制,将全局实体级几何图解耦为局部实体级几何子图;通过基于子等变图神经网络的消息传递机制在各局部实体级几何子图内实现信息交互与融合;根据每个智能体融合后的几何向量分别构建各智能体的局部参考坐标系变换,获得每个智能体的几何变换不变的局部状态;根据每个智能体几何变换不变的局部状态输出每个智能体的动作级控制策略;对各智能体的动作级控制策略进行迭代训练和优化。本公开提升了多智能体系统在复杂环境中的协同和竞争能力及其适应性和鲁棒性。
技术关键词
强化学习方法
实体
控制策略
消息传递机制
标量特征
坐标系
训练智能体
节点
正交变换
关节
策略优化方法
传播算法
动态
邻居
智能体系统
计算机
多层感知器
可读存储介质
代表
位置变更
系统为您推荐了相关专利信息
隔热隔声层
建模方法
三维CAD模型
三维模型
机身结构
装备
自动生成系统
人工神经网络
无人机防御
策略
智能干预系统
数据网络
智能干预方法
深度神经网络架构
特征提取模块
故障判断系统
故障诊断推理
实时监测数据
设备基础
节点