一种基于注意力机制的深度强化学习的多无人机多任务规划方法

正文

推荐专利

申请号：CN202510113708

申请日期：2025-01-24

公开号：CN119937597A

公开日期：2025-05-06

类型：发明专利

摘要

本发明属于无人机任务规划与调度领域，公开了一种基于注意力机制的深度强化学习的多无人机多任务规划方法，旨在解决传统方法在处理高复杂度、大规模任务规划问题时所面临的低效难题。本发明方法包括以下步骤：S1.任务分解与初始分配；S2.建立多无人机任务规划数学模型；S3.建立马尔可夫决策过程；S4.设计掩码策略下的基于注意力机制的深度强化学习模型；S5.结合蜻蜓算法和REINFORCE算法进行策略优化更新；S6.以训练后的模型对多无人机进行任务规划。本发明在面对高复杂度、多约束的大规模任务场景时，相比其它算法计算时间更短，规划结果更高效，并且规模越大对比效果越明显，在不同任务数环境下均能取得较好的效果，其泛化能力更强。

技术关键词

注意力机制蜻蜓算法深度强化学习模型多任务规划掩码策略多无人机任务分配数学模型译码器模糊C均值算法编码器策略更新前馈神经网络集群矩阵

系统为您推荐了相关专利信息

基于微调和知识图谱的元器件自动化表示方法及装置

电子元器件大语言模型图片文本知识图谱数据库

一种基于人工智能的智能厨房机器人

智能厨房机器人智能控制模块菜板移动路径规划炒锅

一种基于多源传感器数据的智能交通决策方法

交通流量预测预测交通流量车辆传感器数据车辆动力学模型决策方法

一种虚拟电厂内部联盟合作博弈的收益分配方法

收益分配方法线性规划模型优化调度模型抽蓄电站光伏电站

一种机器人专用的高效路径规划和避障优化方法及系统

机器人专用样本机器人控制系统因子规划

一种基于注意力机制的深度强化学习的多无人机多任务规划方法

站点导航

APP 下载