针对信任域多智能体强化学习算法的智能体排序方法

正文

推荐专利

申请号：CN202510771344

申请日期：2025-06-10

公开号：CN120893467A

公开日期：2025-11-04

类型：发明专利

摘要

针对信任域多智能体强化学习算法的智能体排序方法，涉及强化学习技术领域。为解决现有技术中存在的，无法根据智能体观测相似性与信息丰富度合理安排训练顺序，导致训练稳定性和协同性不足的缺陷本发明提供的技术方案为：针对信任域多智能体强化学习算法的智能体排序方法，包括：采集各个智能体的观测信息的步骤；计算智能体之间的观测相似度的步骤；根据所述相似度进行排序，生成智能体训练序列的步骤；所述排序包括：优先选择观测相似度低的智能体，结合中心化机制进行聚类优化，用以确定最终排序顺序。适用于需要提升多智能体强化学习训练稳定性与协作性能的复杂任务决策系统中。

技术关键词

体排序方法强化学习算法生成智能多智能体强化学习计算机储存介质强化学习技术聚类排序装置决策系统计算机程序产品序列处理器模块矩阵周期数据

系统为您推荐了相关专利信息

一种基于传统算法和强化学习的自适应拥塞控制切换方法

控制切换方法速率阶段综合效用函数因子

基于运营商策略的网络控制方法和装置、设备及存储介质

节点网络控制方法加密会话数据对称加密算法

一种基于深度对抗训练的智能电网动态图数据生成方法

智能电网数据生成方法时序数据生成模型生成对抗网络

一种机场智能化操作系统

机场智能化操作系统多模态数据采集服务等级协议时间卷积网络异构传感器网络

一种电梯门刀集成化智能故障预警系统

智能故障预警系统电梯门刀传感器监测动态阀值红外检测传感器

针对信任域多智能体强化学习算法的智能体排序方法

站点导航

APP 下载