摘要
本发明公开了一种基于视角不变的多智能体贝叶斯策略重用方法及系统,本发明包括将不同的对手策略看作不同的任务,逐一与使用不同策略的对手进行交互学习最优应对策略并作为受控策略添加至受控智能体的受控策略库中;然后,将配备有策略库的受控智能体与对手智能体进行交互并生成轨迹,通过视角不变情景感知模块对轨迹进行编码获得涵盖环境动态变化信息的上下文特征,并结合上下文特征对应的任务类别构建监督模型作为局部观测模型;基于局部轨迹通过局部观测模型计算似然并根据贝叶斯规则更新信念,受控智能体根据信念从受控策略库中选择最优的应对策略。本发明旨在多智能体协同对抗中能够快速、准确地识别对手策略并重用最优应对策略。
技术关键词
重用方法
上下文特征
编码器
视角
智能体交互
受控机器人
表达式
策略库交互
生成轨迹
多智能体协同
重用系统
K近邻算法
智能体系统
机器人控制
情景
微处理器
可读存储介质
计算机程序产品
系统为您推荐了相关专利信息
退化特征
寿命预测方法
剩余使用寿命预测
神经网络分位数回归
斯皮尔曼相关系数
图像生成方法
噪声预测
场景
交叉注意力机制
掩膜
Wasserstein距离度量
语义向量
样本
多模态注意力
软件
智能控制方法
变量
模糊控制器
选矿自动化技术
模糊规则