一种智能体集群路径规划模型的训练方法和装置

正文

推荐专利

申请号：CN202511237284

申请日期：2025-09-01

公开号：CN120952097A

公开日期：2025-11-14

类型：发明专利

摘要

本方案公开了一种智能体集群路径规划模型的训练方法和装置，该方法包括：构建智能体在当前时间步的第一状态矩阵，将第一状态矩阵输入初始强化学习模型，预测各个智能体在下一个时间步的第二动作信息；基于第二状态矩阵、第一状态矩阵确定智能体集群执行本次任务的奖励得分；构建由目标四元组组成的时间序列数据，将时间序列数据输入各个局部Q网络中，生成局部Q值；将局部Q值通过混合Q网络组合成全局Q值；使用更新后的局部Q网络和混合Q网络继续进行训练，得到智能体集群路径规划模型。本方案的混合Q网络具备时序建模和注意力权重分配能力，各智能体独立决策，实现去中心化控制；采用时间序列数据学习时序依赖，使路径生成更具灵活性。

技术关键词

强化学习模型集群矩阵网络序列规划数据多头注意力机制门控循环单元山地环境仿真平台时序训练装置电子设备时间段程序处理器指令输入模块

系统为您推荐了相关专利信息

一种布料节能生态染整优化方法及其在染整工艺中应用

模糊控制规则神经网络参数布料染料配方染色

用于高层建筑的机器人配餐方法及系统

网络转接系统调度系统电梯主控系统配餐方法高层建筑

一种基于深度学习的非侵入式电网接线图开关状态识别方法、系统、介质及处理器

开关状态识别方法电网接线图混合网络模型检测点电气

一种大脑认知状态分类模型的训练方法和训练装置

大脑认知状态分类注意力融合特征信号功能近红外光谱

一种信息系统工程监理项目风险自适应评估方法及系统

超宽带定位装置动态知识图谱信息系统工程拓扑网络网络设备

一种智能体集群路径规划模型的训练方法和装置

站点导航

APP 下载