基于值分布的多智能体协同控制方法、装置、设备和介质

正文

推荐专利

申请号：CN202410879988

申请日期：2024-07-02

公开号：CN118627535A

公开日期：2024-09-10

类型：发明专利

摘要

本申请涉及一种基于值分布的多智能体协同控制方法、装置、设备和介质，方法包括：构建每个智能体的初始价值网络和多个智能体的初始分布混合网络；基于各智能体的采样数据，对初始分布混合网络和各智能体的价值网络进行训练，通过最小化全局价值分布的损失函数优化初始分布混合网络以及各智能体的价值网络的网络参数，并满足全局价值分布的期望最大、每个智能体的确定性价值最大的约束关系，得到训练好的各智能体的价值网络；根据自身的观测及训练好的价值网络，各智能体执行各自的最优动作。本申请通过在训练过程中综合考虑全局观测、在执行过程中智能体仅利用局部观测做出最优决策方法。

技术关键词

混合网络交通信号灯控制损失函数优化协同控制方法协同控制装置场景参数红绿灯深度神经网络模块决策方法数据红灯网络架构团队处理器计算机设备

系统为您推荐了相关专利信息

无人机的基于样本空间深度参数辅助训练的单步多框神经网络检测模型

多尺度特征特征提取模块抑制算法无人机机器视觉定位单元

一种基于高精度预测模型的注塑工艺参数多目标优化方法

注塑工艺混合优化算法随机噪声 XGBoost模型网格

一种基于气象要素预测的多元天气衍生品定价方法

定价方法温度预测模型投资者天气损失函数优化

基于多视角中心结构的多模态哈希检索方法、系统、设备及介质

原型哈希检索方法多视角文本多层感知器

一种红外船舶图像的分类方法和分类系统

图像分类模型聚类特征船舶特征提取单元分类方法

基于值分布的多智能体协同控制方法、装置、设备和介质

站点导航

APP 下载