摘要
本申请提供了一种多无人机的协同决策控制方法、装置、设备及介质,包括:将多个无人机的任务信息输入至深度强化学习模型之中,基于深度强化学习模型之中的多个Actor网络对多个无人机的任务信息进行信息交互处理预测出每个无人机的下一时刻决策信息;基于位置控制器以及姿态控制器对每个无人机的下一时刻决策信息进行处理,生成每个无人机的下一时刻控制命令;计算出每个无人机的螺旋桨产生的阻力以及地面效应力,基于阻力以及地面效应力对无人机的当前姿态信息进行调整确定出调整后的信息,将调整后的信息反馈至深度强化学习模型之中继续预测出每个无人机在未来时刻的动作信息,提高无人机在复杂环境中的自适应能力和决策自主化水平。
技术关键词
深度强化学习模型
位置控制器
门控循环单元
决策
多无人机
执行动作信息
注意力机制
动作特征
样本
网络
螺旋桨
角速度信息
机器可读指令
多层感知器
命令
阻力
姿态控制器
效应
系统为您推荐了相关专利信息
工业控制系统
工业自动化控制技术
数据
因子
控制器
风险预警方法
驾驶风格识别
车辆
意图
风险预警系统
元胞自动机模型
换道方法
车道
运动状态信息
策略
运动规划方法
车辆行驶状态信息
车轮转向角
加速度
横摆角速度
综合管理系统
动态贝叶斯网络
工程监理
风险预测模型
智能合约验证