摘要
本发明公开了一种基于强化学习算法的分布式机动平台任务规划及调整方法和系统,具体为:首先根据多无人机系统的任务需求及约束条件,建立分布式部分马尔可夫决策过程模型;然后基于强化学习算法,建立基于分布式部分马尔可夫决策过程的任务规划模型,优化目标为最小化任务执行代价及最大化覆盖效能;接着基于任务规划优化模型,设计分布式机动平台任务规划及调整系统模型,并采用SAC算法进行模型训练;最后根据训练好的分布式机动平台任务规划及调整系统模型输出结果,生成无人机的任务分配与路径规划方案。本发明能够在信息不完备的情况下动态调整分布式机动平台责任区分配和任务规划,具有任务执行能力强、任务规划精度高、实时性强的优点。
技术关键词
强化学习算法
规划
多无人机系统
SAC算法
强化学习框架
优化网络参数
生成训练数据
平台
策略
生成无人机
决策
路程
神经网络参数
动态
引导无人机
初始化系统
效能
系统为您推荐了相关专利信息
配送方法
交通流量预测
进化算法
城市智能交通
模拟退火算法
强化学习方法
扰动观测器
机械臂系统
轨迹跟踪控制
反馈控制策略