摘要
本发明公开了一种基于数字孪生的可扩展深度强化学习无人机集群协同搜索方法。该方法采用了一种可扩展多智能体强化学习算法SAMARL,融合了多智能体近端策略优化算法和多头注意机制,提高算法有效性和自适应性。在SAMARL框架中,构建了包含图形表征和环境认知图的复杂观测空间,综合优化目标搜索率、区域覆盖率、搜索时间和协同安全。设计了基于视场范围的观测空间,提升了模型训练速度。然后,提出了“孪生式训练、分布式执行、持续进化”搜索训练框架,实现决策模型从模拟到现实的迁移。将智能决策模型部署到每架无人机,集群利用场强仪和通信电台分布式协同搜索未知信号源。大量实验结果表明,该方法在搜索效率和系统扩展性上优于现有先进策略。
技术关键词
无人机集群协同
引导无人机
策略
深度强化学习
生成无人机
搜索方法
数字孪生
梯度方法
多智能体强化学习
网络
场强仪
智能决策模型
无人机传感器
信号源
门控循环单元
分布式协同
网格
构建无人机
系统为您推荐了相关专利信息
车辆状态数据
深度确定性策略梯度
需求预测模型
温控
时间段
梯级水库
优化调控方法
神经网络模型
物理
混合损失函数