摘要
本发明涉及无人机集群协同决策技术领域,具体为一种无人机集群协同决策的多智能体强化学习方法,包括:获取多源信息,基于视觉惯性里程计算法和邻近无人机状态信息进行多机联合迭代,获得无人机集群状态估计并生成校正IMU数据;构建环境感知因子图,生成自身状态向量;采用多智能体近端策略优化算法训练协同Actor网络,输入任务信息、视觉图像数据和自身状态向量,输出飞行动作指令。本发明通过融合多机联合状态估计和语义感知,实现了无人机集群在未知复杂环境下的高精度、高鲁棒协同决策,提升了任务执行能力。
技术关键词
智能体强化学习方法
无人机集群协同
因子
语义
非线性优化算法
物体位置信息
决策
数据
视觉里程计
图像
校正
联合状态估计
网络更新过程
节点
偏差
在线