基于混合模仿学习的多智能体追捕决策方法及系统

正文

推荐专利

申请号：CN202411948286

申请日期：2024-12-27

公开号：CN120046646A

公开日期：2025-05-27

类型：发明专利

摘要

本发明提供了基于混合模仿学习的多智能体追捕决策方法及系统，包括：在专家轨迹数据的类型为多模态时，采用多专家轨迹生成对抗模仿学习方法对专家轨迹数据进行训练，以得到第一决策模型；在专家轨迹数据的类型为单模态时，采用时序差分误差行为克隆方法对专家轨迹数据进行训练，以得到第二决策模型；将第一决策模型和第二决策模型赋予智能体，并通过智能体对第一决策模型和第二决策模型进行推演，得到混合追捕决策模型；智能体通过追捕决策模型对含有动静目标的追捕场景进行决策处理，以得到相应追捕策略；该方法将时序差分误差行为克隆和多专家轨迹生成对抗模仿学习进行有效结合，以提升多智能体系统在复杂、动态环境中的决策与协作能力。

技术关键词

决策方法模仿学习方法克隆方法生成轨迹数据场景学生时序网络多智能体系统强化学习算法可读存储介质匹配误差决策系统策略更新电子设备

系统为您推荐了相关专利信息

基于多源遥感数据的城市绿地碳汇动态监测方法及系统

多源遥感数据动态监测方法输入端太阳方位角双时间尺度

针对轻度认知功能障碍的音乐情绪调节结合记忆强化方法

轻度认知功能障碍音乐强化方法强化学习模型记忆

一种雨量监测数据修正优化方法

电容粒子群优化算法偏差电压监测传感器

基于二次开发实现带式输送机施工图绘制的方法及系统

规划聚类元素带式输送机计算机存储介质

一种海上溢油事故自动智能应急围油栏系统

围油栏系统中控模块智能应急溢油事故压力传感器单元

基于混合模仿学习的多智能体追捕决策方法及系统

站点导航

APP 下载