一种基于置换策略网络的移动多智能体知识迁移方法

正文

推荐专利

申请号：CN202511002106

申请日期：2025-07-21

公开号：CN120893518A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于置换策略网络的移动多智能体知识迁移方法，涉及多智能体强化学习技术领域。包括：将置换不变性策略网络与置换同变性策略网络嵌入超网络框架，通过超网络动态生成输入层与输出层权重矩阵，建立联合状态‑动作空间与智能体规模、环境变化的动态适配关系；引入置换矩阵特性实现智能体顺序无关性与任务目标响应性的解耦，并通过集中式训练‑分布式执行架构优化策略网络参数；构建包含置换不变性与同变性约束的知识迁移模型；实现相似域任务间策略的高效迁移。本发明解决了动态复杂环境下智能体规模变化与联合状态‑动作空间维度爆炸导致的知识迁移低效问题。

技术关键词

知识迁移方法超网络策略多智能体强化学习技术矩阵深度强化学习算法动态框架规模点分配参数障碍物关系广义数学比率决策场景

系统为您推荐了相关专利信息

一种基于图像识别的滑触线状态异常检测方法

异常检测方法桥式起重机滑触线轨道多头注意力机制实时视频

一种面向浓烟环境的人体目标判别算法系统

浓烟环境判别算法成像特征热成像视频采集模块

基于深度学习的TAC膜预干燥智能温控系统

溶剂挥发速率智能温控系统序列温度预测模型温度传感器

神经网络鲁棒精度权衡学习的自适应优化框架

鲁棒性评估策略阶段框架精度

基于变更AST的漏洞修复检测方法

修复检测方法注意力模型节点抽象语法树前馈神经网络

一种基于置换策略网络的移动多智能体知识迁移方法

站点导航

APP 下载