一种基于视角不变的多智能体贝叶斯策略重用方法及系统

正文

推荐专利

申请号：CN202411699940

申请日期：2024-11-26

公开号：CN119204087B

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开了一种基于视角不变的多智能体贝叶斯策略重用方法及系统，本发明包括将不同的对手策略看作不同的任务，逐一与使用不同策略的对手进行交互学习最优应对策略并作为受控策略添加至受控智能体的受控策略库中；然后，将配备有策略库的受控智能体与对手智能体进行交互并生成轨迹，通过视角不变情景感知模块对轨迹进行编码获得涵盖环境动态变化信息的上下文特征，并结合上下文特征对应的任务类别构建监督模型作为局部观测模型；基于局部轨迹通过局部观测模型计算似然并根据贝叶斯规则更新信念，受控智能体根据信念从受控策略库中选择最优的应对策略。本发明旨在多智能体协同对抗中能够快速、准确地识别对手策略并重用最优应对策略。

技术关键词

重用方法上下文特征编码器视角智能体交互受控机器人表达式策略库交互生成轨迹多智能体协同重用系统 K近邻算法智能体系统机器人控制情景微处理器可读存储介质计算机程序产品

系统为您推荐了相关专利信息

一种融合多域退化特征与分位数回归的寿命预测方法

退化特征寿命预测方法剩余使用寿命预测神经网络分位数回归斯皮尔曼相关系数

一种海上场景图像生成方法及装置

图像生成方法噪声预测场景交叉注意力机制掩膜

一种对抗生成式闭源软件二进制样本方法

Wasserstein距离度量语义向量样本多模态注意力软件

一种音频推送系统、方法、设备、介质及产品

虚拟终端音频编码采样率异构音频推送系统

一种基于多级工况识别与预测的半自磨过程智能控制方法

智能控制方法变量模糊控制器选矿自动化技术模糊规则

一种基于视角不变的多智能体贝叶斯策略重用方法及系统

站点导航

APP 下载