一种基于记忆推理的异构巡飞集群自主协同规划方法

正文

推荐专利

申请号：CN202510592128

申请日期：2025-05-09

公开号：CN120578210A

公开日期：2025-09-02

类型：发明专利

摘要

本申请属于强化学习技术领域。本申请提供一种基于记忆推理的异构巡飞集群自主协同规划方法。该方法包括：针对异构巡飞集群的智能体训练仿真环境，为每个智能体构建马尔可夫决策过程；构建智能体动力学模型；初始化仿真环境；通过环境交互采样获取数据，更新双记忆模块，利用记忆推理模块对长期记忆模块数据进行处理，结合情节激励机制生成激励系数，与短期记忆模块中的数据共同计算目标Q值和当前Q值，并加权损失函数更新动作价值网络。基于策略网络和熵网络计算损失，更新策略网络及熵网络参数并周期性更新记忆推理模块；若满足结束条件停止训练，输出训练完成的多智能体强化学习模型。

技术关键词

协同规划方法记忆异构集群仿真环境网络加权损失函数模块加速度策略多智能体模型解码器强化学习技术编码器强化学习模型双轨结构重建误差数据参数障碍物

系统为您推荐了相关专利信息

一种用于电路板控制器的运行异常监测方法及系统

自动化机器人电路板控制器工作参数数据异常监测方法

供应商行为实时感知监测方法、装置及电子设备

监测方法谱聚类算法资质证书多源异构数据 LSTM模型

一种基于文件交互实现集群数据批量处理的方法及系统

集群登记表数据处理模块 hash算法主节点

融合电力电网信息的铁路运维通信网优化系统

网络拓扑优化数据立方体动态资源调度铁路动态贝叶斯网络

一种基于人工神经网络的逆变型电源构网型控制方法

人工神经网络深度前馈神经网络序列电气电源

一种基于记忆推理的异构巡飞集群自主协同规划方法

站点导航

APP 下载