摘要
本申请涉及多智能体技术领域,特别涉及一种基于强化学习的通信协作方法及系统。所述方法包括每个智能体获取其自身的局部观测信息,基于局部观测信息确定隐藏状态及动作;基于隐藏状态确定智能体与邻居智能体间的硬交互值,基于局部观测信息确定智能体与邻居智能体间的交互强度;基于硬交互值、交互强度及隐藏状态确定接收信息贡献;基于每个智能体的局部观测信息、动作及接收信息贡献构建智能体的Q值,并基于所有智能体的Q值训练强化学习以输出通信协作策略;基于强化学习模型确定作战场景中的通信协作策略。本申请基于局部观测信息、动作及接收信息贡献构建Q值,可以实现能体间高效且公平的信用分配,提高了通信协作的效率。
技术关键词
通信协作方法
邻居
注意力模型
多层感知机
多智能体技术
动作特征
策略
强度
强化学习模型
场景
视野
关系
数据
标识
系统为您推荐了相关专利信息
WiFi指纹
网格
WiFi信号强度
训练特征
生成特征
交通流预测算法
特征提取器
交通流预测方法
多层感知机
序列特征
人体三维重建
三维人体模型
点云
着装人体
多尺度注意力机制
人脸活体检测方法
顶点特征
模糊C聚类
图像块
三元组损失函数