摘要
本发明属于无人机任务规划与调度领域,公开了一种基于注意力机制的深度强化学习的多无人机多任务规划方法,旨在解决传统方法在处理高复杂度、大规模任务规划问题时所面临的低效难题。本发明方法包括以下步骤:S1.任务分解与初始分配;S2.建立多无人机任务规划数学模型;S3.建立马尔可夫决策过程;S4.设计掩码策略下的基于注意力机制的深度强化学习模型;S5.结合蜻蜓算法和REINFORCE算法进行策略优化更新;S6.以训练后的模型对多无人机进行任务规划。本发明在面对高复杂度、多约束的大规模任务场景时,相比其它算法计算时间更短,规划结果更高效,并且规模越大对比效果越明显,在不同任务数环境下均能取得较好的效果,其泛化能力更强。
技术关键词
注意力机制
蜻蜓算法
深度强化学习模型
多任务
规划
掩码策略
多无人机任务分配
数学模型
译码器
模糊C均值算法
编码器
策略更新
前馈神经网络
集群
矩阵
系统为您推荐了相关专利信息
电子元器件
大语言模型
图片
文本
知识图谱数据库
智能厨房机器人
智能控制模块
菜板
移动路径规划
炒锅
交通流量预测
预测交通流量
车辆传感器数据
车辆动力学模型
决策方法
收益分配方法
线性规划模型
优化调度模型
抽蓄电站
光伏电站