摘要
本发明公开了一种不完全信息条件下的智能群体协同追捕方法与系统。首先建立智能体的运动学模型,构建带有障碍物分布的多智能体训练环境模拟真实追捕场景的物理交互;根据智能体特性构建联合状态空间和动作空间,并设计基于局部感知信息设计的合作探索空间映射;设计带有内在激励的强化学习算法架构,通过Actor控制网络融合目标追踪信息与群体协作的机动策略,并由Critic评价网络对动态环境下的协同效能进行评估;最后,在系统性构建的奖励函数与基于内在激励奖励的Actor‑Critic网络训练流程基础上,实现对多智能体在不完全信息条件下的高效协同追捕动态控制。本发明可实现在感知受限的不完全信息条件下多智能体协同追捕的动态控制。
技术关键词
深度强化学习方法
多智能体协同
计数表
深度强化学习算法
仿真环境
策略
环境状态信息
高维特征向量
障碍物
网络
生成动作
动作特征
哈希表
数值
动态
决策
场景
模块
基础
系统为您推荐了相关专利信息
导航避障方法
深度强化学习
深度学习服务器
集群
微纳机器人
高速公路合流区
协同控制方法
线圈检测器
时序特征
仿真环境
人形机器人
策略优化模型
动作策略
多头注意力机制
关节
无线射频识别天线
无线射频识别标签
电气设备
信号覆盖范围
布局优化方法