摘要
本发明公开了一种基于渐进式通信的多智能体全局共识协同方法,涉及多智能体深度强化学习技术领域,本发明通过编码模块更新智能体i的自身认知通过注意力模块生成权重向量αi和通信信息根据权重向量αi的相似性将智能体进行分组,并生成通信掩码MASK1和MASK2;通信模块在第一阶段将信息和掩码MASK1作为局部视觉转换器的输入生成局部共识hL,在第二阶段将局部共识hL和掩码MASK2作为全局视觉转换器的输入促进形成全局共识hG;Q‑值模块将智能体i的自身认知局部共识和全局共识作为输入生成Q‑值函数建立KL散度模块和重构模块,促进多智能体之间全局共识的对齐。本发明的优点在于提出一种渐进式的多智能体通信方法来逐步推动全局共识的达成。
技术关键词
协同方法
多智能体深度强化学习技术
转换器
重构模块
多层感知器
门控循环单元
全局通信
编码模块
多智能体强化学习
视觉
编码器
通信模块
深度神经网络
混合网络
生成智能
解码器
信息通信
注意力机制
系统为您推荐了相关专利信息
逆变器
综合故障
故障预测方法
多模态传感器
多层感知器
二值化图像
图像处理方法
图像处理装置
主控芯片
像素点
生成对抗网络
自动生成系统
重构模块
深度神经网络
仿真环境
图像信号处理器
车辆座舱
芯片
机器可读指令
映射关系表