摘要
本发明公开了基于好奇心机制下的多智能体经验探索协同方法,包括构建多智能体决策架构;构建适用于多智能体决策架构的好奇心机制;构建适用于多智能体决策架构的经验探索组件;构建经验回放池与状态回放池;适配多智能体协作对抗环境;对得到的基于好奇心机制下的多智能体经验探索决策架构所构成的深度神经网络进行训练,得到多智能体经验探索协同策略模型;在多智能体经验探索协同策略模型中,对当前对抗场景下的多智能体协作对抗策略进行求解。通过上述方式,本发明能够平衡多智能体算法在训练时探索与利用的过程,缓解多智能体对抗环境中奖励稀疏性所带来的影响,帮助多智能体进行有经验地探索,为对抗寻找的最优策略的同时提高了学习的效率。
技术关键词
协同方法
多智能体协作
神经网络参数
机制
车辆自动驾驶控制系统
策略
矩阵
决策
深度神经网络
多层感知器
多智能体强化学习
混合网络模型
收集训练数据
超网络
场景
贝叶斯方法
前馈神经网络
对抗系统
系统为您推荐了相关专利信息
通用生成函数
铁路信号设备系统
可靠性分析方法
退化模型
表达式
强化学习模型
融合特征
轨迹特征
多模态特征融合
动态
多模态数据融合
高性能低成本
交叉注意力机制
焦点损失函数
状态空间方程
内容推荐方法
跨设备
画像
主题模型
个性化推荐算法
柔性电极阵列
交互系统
抗干扰控制
差分隐私
医疗人工智能技术