一种用于多智能体系统的联合决策模型训练方法、设备及存储介质

正文

推荐专利

申请号：CN202511117208

申请日期：2025-08-11

公开号：CN120974190A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及机器学习技术领域，涉及一种用于多智能体系统的联合决策模型训练方法、设备及存储介质；其中，一种用于多智能体系统的联合决策模型训练方法包括获取多个智能体的局部观测数据；构建联合决策模型的网络结构；利用训练数据集对联合决策模型的网络进行迭代训练直到达到训练停止条件；在每次训练中，执行以下步骤：联合决策模型分别根据各智能体的局部观测数据推导出各智能体的共识分布；通过对比学习对齐多智能体系统中多个智能体的共识分布，计算联合决策模型的损失函数；根据损失函数更新联合决策模型的网络参数，得到最终的联合决策模型。本发明能够提升智能体在合作任务中的性能，提升多智能体合作系统决策的准确性。

技术关键词

决策模型训练方法多智能体系统数据处理器网络结构机器学习技术可读存储介质时序电子设备参数存储器在线计算机策略表达式

系统为您推荐了相关专利信息

一种核电站智能化消防响应指挥协同系统

核电站协同系统通信子系统智能化消防火灾自动报警系统

基于多模态的行为预警方法、装置、电子设备和存储介质

意图类别融合特征多模态预警方法数据

一种眼镜的调焦方法、装置、智能眼镜及存储介质

卷积神经网络模型图像传感器数据调焦方法环境光传感器数据智能眼镜

基于移动感知机器人的城市环境监测方法

城市环境监测方法感知机器人图像采集节点图像采集控制环境监测数据

面向仿真推演的复杂对抗条件下作战方案评估方法

效能线性规划算法军事运筹技术度量作战仿真系统

一种用于多智能体系统的联合决策模型训练方法、设备及存储介质

站点导航

APP 下载